Академический Документы
Профессиональный Документы
Культура Документы
Proyecto de Investigacin Programa de doctorado Tecnologas de la Informacin Departament de Electrnica, Informtica i Automtica Universitat de Girona
A Natalia, hermosa compaera, que me ha brindado su apoyo y amor en todo momento. A mi hija Sabina, que con su aire infantil es motivo da a da de nuevos horizontes.
Reconocimientos
En primer lugar, quiero agradecer a la Universitat de Girona por haberme dado la oportunidad de realizar estos estudios al concederme una beca de investigacin. Tambin quiero agradecer a mi director de tesis Dr. Ramn Fabregat Gesa por su constante apoyo y valioso asesoramiento durante la realizacin de este trabajo de investigacin. Por ltimo, agradecer al grupo de investigacin de Redes de Comunicaciones y Sistemas Distribuidos del Departament dElectrnica, Informtica i Automtica de la Universitat de Girona por su apoyo incondicional.
Indice
12INTRODUCCIN..........................................................................................................................8 CONSIDERACIONES GENERALES .......................................................................................10 2.1 REDES HETEROGNEAS ...............................................................................................................10 2.2 NOMADICIDAD - NOMADICITY ....................................................................................................11 2.3 CARACTERSTICAS PARA LA ADAPTACIN ...................................................................................13 2.4 ADAPTABILIDAD ADAPTATIVIDAD ...........................................................................................14 2.5 MODELOS PARA SISTEMAS HIPERMEDIA ......................................................................................15 2.5.1 The Dexter Hypertext Reference Model Modelo de Dexter .............................................15 3ESTADO DEL ARTE ..................................................................................................................19 3.1 PROPUESTAS GLOBALES..............................................................................................................19 3.1.1 Hewlett Packard Laboratories ...........................................................................................19 3.1.2 Microsoft Research China ..................................................................................................22 3.2 LAS CARACTERSTICAS Y PREFERENCIAS DEL USUARIO ...............................................................25 3.2.1 De Bra y Brusilovksy ..........................................................................................................25 3.2.1.1 Adaptacin de Contenidos (Content-Adaptation)...........................................................26 3.2.1.2 Adaptacin de Enlaces (Link-Adaptation)......................................................................26 3.2.1.3 AHAM (Adaptive Hypermedia Application Model): Modelo de Referencia para Hipermedia Adaptativa basado en el Modelo de Dexter ................................................................27 3.2.2 MAS-PLANG ......................................................................................................................29 3.2.3 Sitios Web Adaptativos .......................................................................................................30 3.2.4 Filtrado de Informacin Information Filtering ...............................................................33 3.2.5 Agentes de Informacin Inteligentes - Algoritmos de aprendizaje .....................................34 3.2.6 Conclusiones del apartado .................................................................................................35 3.3 EL DISPOSITIVO DE ACCESO DEL CLIENTE ....................................................................................36 3.3.1 Proyecto UMA Universal Multimedia Access .................................................................36 3.3.2 Proyecto MONADS.............................................................................................................38 3.3.3 InfoPyramid........................................................................................................................39 3.3.4 Digestor ..............................................................................................................................40 3.3.5 Conclusiones del apartado .................................................................................................41 3.4 TIPO DE ACCESO Y ESTADO DE LA RED .......................................................................................42 3.4.1 CAIDA ................................................................................................................................42 3.4.2 Estimaciones sobre redes Best-Effort .................................................................................43 3.4.3 Conclusiones del apartado .................................................................................................45 3.5 ESTADO DE CARGA DEL SERVIDOR ..............................................................................................46 3.5.1 Adaptacin de los Contenidos Web Web Content Adaptation .........................................46 3.5.2 Web Caching ......................................................................................................................48 3.5.3 Prefetching .........................................................................................................................49 3.5.4 Caching y Prefetching ........................................................................................................49 3.5.5 Web Servers ........................................................................................................................50 3.5.6 Conclusiones del apartado .................................................................................................50 4SHAAD: SISTEMA HIPERMEDIA ADAPTABLE, ADAPTATIVO Y DINMICO ..........52 4.1 ESTRUCTURA DE SHAAD ...........................................................................................................54 4.1.1 Submodelo Estado de carga del servidor ...........................................................................57 4.1.2 Submodelo Caractersticas y preferencias del usuario ......................................................58 4.1.3 Submodelo Acceso a la red: Dispositivo del cliente, Tipo de Acceso y Estado de la Red ..59 4.1.4 Modelo del SHAAD ............................................................................................................60 4.2 IMPLEMENTACIONES ...................................................................................................................61 4.2.1 Analizador de Contenidos...................................................................................................61 4.2.1.1 Fase 1 Transformacin del documento HTML a XHTML ............................61 4.2.1.2 Fase 2 Redireccin de les peticiones .................................................................62 4.2.1.3 Fase 3 Obtencin del perfil de adaptacin a aplicar ........................................62
Pagina 4
4.2.1.4 4.2.1.5
Fase 4 Obtencin del documento HTML adaptado .........................................65 Fase 5 Asignacin de valores..............................................................................65
4.2.2 El protocolo HTTP .............................................................................................................65 4.3 CONCLUSIONES ...........................................................................................................................66 56PLAN DE TRABAJO...................................................................................................................67 REFERENCIAS ...........................................................................................................................68
Pagina 5
Lista de Figuras
Figura 1 Espectro de adaptacin en sistemas de computadores Figura 2 Modelo de Dexter Figura 3 Ilustracin de la necesidad de presentation specifications en el camino de acceso (enlaces) as como en los componentes mismos. Figura 4 Descripcin de tres capas del modelo de Dexter implcitas en un sistema de hipertexto real Figura 5 Marco de trabajo bsico para el Sistema de entrega de contenido adaptativo de [MA00] Figura 6 Listado de los parmetros de entrada y los algoritmos de salida alrededor del Motor de Decisin de [MA00] Figura 7 Arquitectura del Sistema Figura 8 Estructura bsica del sistema AWCD Figura 9 Taxonoma actualizada de las tecnologas hipermedia adaptativas Figura 10 Modelo de AHAM Figura 11 Representacin de estructuras de navegacin y contenidos de aprendizaje en unidades docentes USD Figura 12 Arquitectura general del sistema Figura 13 Testbed utilizado en el proyecto UMA Figura 14 Modelo de Adaptacin de Monads Figura 15 Entrega de contenidos multimedia escalable para dispositivos Pervasive Computing Figura 16 Esquema de InfoPyramid Figura 17 Representacin del estado de la red bajo condiciones controladas del flujo de trnsito Figura 18 Componentes que actan en SHAAD Figura 19 Modelo del SHAAD Figura 20 Submodelo para SHAAD considerando el acceso a la red Figura 21 Submodelo para SHAAD considerando las caractersticas o preferencias del usuario Figura 22 Submodelo para SHAAD considerando el acceso a la red Figura 23 Modelo del SHAAD Figura 24 Fases del diseo 14 16 18 18 20 21 23 24 28 29 31 33 37 38 39 40 44 53 56 57 58 59 60 61
Pagina 6
Lista de Tablas
Tabla 1 rea de investigacin de los grupos descritos Tabla 2 Herramientas para definicin y soluciones adoptados por los diferentes grupos reseados Tabla 3 Valores de activacin de los perfiles Tabla 4 Parmetros que influyen en el tipo de perfil a aplicar Tabla 5 Esquema de los elementos enviados segn el perfil definido 53 55 63 64 64
Pagina 7
1 - Introduccin
Uno de los presentes desafos de Internet est dirigido a la problemtica surgida por la necesidad de una entrega adecuada de contenidos en un entorno web totalmente heterogneo. Esta heterogeneidad se plantea en trminos de necesidades-preferencias de los usuarios, tipos y capacidades de los dispositivos de acceso, ancho de banda y estado de la red. Caractersticas, que no son tenidas en cuenta por el servidor a la hora de entregar los contenidos web ricos en imgenes, audio y video. As por ejemplo, el servidor entrega el documento solicitado aunque el terminal utilizado (WebTV, Personal Digital Assistant (PDA) o telfono mvil) no pueda acceder a estos contenidos, debido a las limitaciones del monitor, de las capacidades de almacenamiento, de procesamiento o de acceso a la red. Por otra parte, esta entrega se realiza, muchas veces sin considerar el estado de carga que tiene el servidor en ese momento. Situacin que pone, an ms, en evidencia la carencia de una gestin inteligente de las redes. Para solucionar este problema se deben desarrollar alternativas que permitan un acceso universal a cualquier tipo de material, desde cualquier tipo de dispositivo y que tengan en cuenta caractersticas tales como las preferencias del usuario, el estado de carga de la red y/o del servidor. Ahora bien, una gestin inteligente de redes con calidad de servicio incide bsicamente en dos aspectos de las redes con estos requerimientos: La gestin de la red, es decir, la gestin de los recursos y fallos de la red. La calidad de servicio desde la ptica de las aplicaciones adaptativas
Bajo el primer concepto, se alinean todas las investigaciones que giran alrededor de tecnologas tales como ATM, MPLS, DiffServ, IntServ, etc. Mientras que en torno a las aplicaciones adaptativas, vemos que la problemtica es abordada desde la consideracin de las caractersticas antes mencionadas y las soluciones nos conducen al planteo referente al formato, al tipo de contenido o la estructura de la informacin a transferir. Muchos son los grupos de investigacin avocados a la tarea de la implementacin de sistemas adaptativos. Cada uno ha planteado sus soluciones teniendo en cuenta algunas o todas las caractersticas antes mencionadas (preferencias del usuario, tipo de dispositivo, red, etc.). As por ejemplo, podemos mencionar a: Grupos de investigacin de Hewlett Packard [MA00] y de Microsoft Research China [YAN00] que trabajan sobre un Adaptive Delivery Systems. Tienen en cuenta el tipo de dispositivo de acceso, el estado de la red y las preferencias del usuario. Paul de Bra [BRA99] [BRA99-1]. A partir sus conceptos sobre un Adaptive Hipermedia System (AHS) y teniendo en cuenta las preferencias del usuario (modelo del usuario), se plantea el cambio de los contenidos o de la presentacin de los nodos alterando la estructura de los enlaces. UMA (Universal Multimedia Acces) [APER01] [APER01-1]. Tiene en cuenta las nuevas clases de dispositivos inteligentes y portables. La finalidad del proyecto es permitir a los dispositivos de acceso con limitaciones en las capacidades de comunicacin, procesamiento y visualizacin acceder a cualquier contenido multimedia. MONADS [RAA99][RAA99-1][MIS99]. Est dirigido a solucionar la demanda de los servicios de datos anytime-anywhere-anyhow (en cualquier momento, cualquier lugar y de cualquier manera) a travs de las nuevas tecnologas de dispositivos mviles. La adaptabilidad de los servicios de datos a los cambios de entorno de los usuarios nmadas es el tema principal de este proyecto. Entendindose por nmada a los
Pagina 8
usuarios que cambian permanentemente de lugar y posiblemente de dispositivo y de tipo de acceso. En este proyecto los agentes inteligentes juegan un papel muy importante en la implementacin de la adaptabilidad. Abdelzaher y Bat [ABD99]. Proponen resolver el problema de la sobrecarga del servidor adaptando los contenidos entregados a las condiciones de carga de dicho servidor.
Como puede observarse, los distintos trabajos se concentran en algunas o todas las caractersticas mencionadas a la hora de realizar una adaptacin de contenidos. En el presente trabajo de investigacin se presenta una propuesta para la implementacin de un sistema integral, en el cual se consideren todas las caractersticas anteriormente mencionadas. Es decir, necesidades y/o preferencias de los usuarios, tipos y capacidades de los dispositivos de acceso, ancho de banda, estado de la red y estado de carga del servidor. El sistema, a su vez, intenta tipificar a travs de un modelo nico, las diferentes variaciones de un sistema para la entrega de contenidos adaptados en el que se consideren las caractersticas mencionadas arriba. Por otra parte, trata de aunar los conceptos vertidos en las distintas lneas de investigacin a fin de reutilizar el marco terico desarrollado y generalizarlo en estos mbitos de trabajo. Queda claro, en los captulos posteriores, como el entorno de contenidos adaptativos es abordado y denominado de diferentes maneras dependiendo del punto de anlisis que se lleve adelante. As por ejemplo, Paul de Bra habla de Sistemas Hipermedias Adaptativos cuando trata la modelizacin del usuario; UMA, MONADS y el grupo de Hewlett Packard, aborda la entrega de contenidos adaptativos; en el caso de los trabajos sobre la carga del servidor tratan con conceptos tales como las web adaptativas o la adaptacin de contenidos. El sistema propuesto, extiende los diferentes conceptos vertidos en cada rea de investigacin a fin de conseguir trabajar con uno tan simple y a la vez general como lo es la adaptacin de contenidos en entornos de red heterogneo y as plantear un sistema hipermedia adaptativo en lneas generales. En el Captulo 1 se exponen los conceptos que delinearn el marco general de trabajo para nuestro sistema. En el Captulo 2, se exponen algunos de los trabajos realizados por diferentes grupos de investigacin en el campo de la adaptacin, los cuales sern presentados de acuerdo a la caracterstica adoptada como centro del problema a resolver (caractersticas/preferencias del usuario, tipo de dispositivo de acceso, etc.). Aqu se resaltar, especialmente, el enfoque tenido en cuenta por estas investigaciones, los aspectos ms importantes de trabajo y las soluciones adoptadas en cada caso. En el Captulo 4, presentamos la propuesta de SHAAD - Sistema Hipermedia, Adaptable, Adaptativo y Dinmico - para la entrega de contenidos adaptativos. En este punto del trabajo, veremos como a partir de submodelos, planteados para cada una de las caractersticas consideradas, llegamos a un modelo final que ser el que adoptaremos para nuestro sistema. Se expone tambin en este captulo un avance de la implementacin de nuestro Analizador de Contenidos y las consideraciones hechas sobre el protocolo HTTP, como herramienta para la definicin de las caractersticas del usuario y el tipo de dispositivo de acceso. Finalmente, se exponen los futuros trabajos a realizar a travs de un plan de trabajo que tiene como objetivo consolidar el funcionamiento del SHAAD.
Pagina 9
2 - Consideraciones generales
2.1 Redes Heterogneas
En primer lugar, analizaremos conceptos generales con el fin de justificar nuestro entorno de aplicacin. El porqu? de la necesidad de la consideracin de las redes heterogneas y el anlisis de conceptos muy generalizados sobre acceso universal a la red (Universal Access). Actualmente, el crecimiento explosivo de Internet se ha reflejado, tanto en el incesante incremento de la informacin existente como en la diversidad y heterogeneidad existente en lo que a preferencias del usuario final, dispositivos de acceso y conexiones se refiere. Muchas son las nuevas tecnologas disponibles como dispositivos de acceso a la red. Estas van desde simples ordenadores de escritorio hasta los nuevos dispositivos mviles, como son los handheld computers o los PDAs (Personal Digital Assistans). De igual manera, los distintos tipos de conexin a la red, se diversifican dia a da. Y as, se ha transitado desde las viejas conexiones va mdem, con anchos de banda de 9.6K - 28.8, pasando por la conexiones ISDN, DSL o cable mdem, con anchos de banda intermedios entre 128K - 1.5M, hasta las conexiones de las redes Ethernet de 10M - 100M. Esta diversidad, desde el punto de vista tecnolgico, tiene sus consecuencias. Los contenidos multimedia, paralelamente en los sitios web, se han incrementado notablemente con el fin de utilizar la potencialidad provista por estas nuevas tecnologas. sto, no signific necesariamente el hecho de considerar diferentes diseos para los diferentes tipos de clientes. Y como resultado, nos encontramos diariamente con las frustrantes experiencias de las lentas entregas de contenido o la incapacidad de ver ciertos tipos de contenidos multimedia. La falta de la infraestructura necesaria para acomodar este crecimiento heterogneo ha planteado un nuevo objetivo: la necesidad de generar los mecanismos necesarios para que cualquier usuario sobre Internet pueda tener un acceso efectivo y universal a la informacin. En este punto, vale la pena rescatar dos conceptos muy generalizados: Acceso Universal (Universal access) [MA00] [W3C99]. Es el concepto lanzado por la comunidad investigadora para dirigir las cuestiones tcnicas que permitan el acceso a la informacin en entornos de red heterogneos, acomodando las necesidades de los usuarios y las restricciones de los dispositivos de los clientes y las caractersticas de la red. El objetivo del Acceso Universal es proveer la infraestructura de Internet necesaria para permitir a los usuarios acceder a cualquier informacin sobre cualquier red desde cualquier lugar y a travs de cualquier tipo de dispositivo del cliente. Para alcanzar este objetivo, los contenidos web podran necesitar ser transformados en representaciones adecuadas antes de ser entregadas a los clientes. Es decir, estamos hablando de una entrega de contenidos que se adecue a las condiciones particulares en un dado momento. Entrega adaptativa de contenido (Adaptive Content Delivery). Es la tecnologa que transforma los contenidos web y los esquemas de entrega de acuerdo a la heterogeneidad de los visualizadores y cambiando las condiciones a fin de
Pagina 10
posibilitar un acceso universal. El objetivo de la Entrega adaptativa de contenido es tener en cuenta estas condiciones cambiantes y heterogneas para proveer la mejor accesibilidad y calidad de servicio de la informacin.
Nomads y Nomadicity: en el presente informe usaremos estos dos trminos en lugar de su traduccin literal para seguir con las denominaciones internacionalmente estandarizadas.
Pagina 11
entrevista de evaluacin personal en los negocios, las reuniones de gobierno, y los encuentros familiares para decidir sobre las vacaciones son los ejemplos ms comunes de la necesidad de interactividad. El lugar: por varias razones, la gente frecuentemente lleva adelante sus negocios en otros lugares ms que en sus oficinas. Algunos sitios son preferibles frente a otros. Por otro lado las personas muchas veces se encuentran en medio de situaciones con oportunidades de negocios sin haberlo previsto.
Por todas estas situaciones, podemos inferir que la Nomadicity es actualmente uno de los fenmenos que han tenido ingerencia en el desarrollo de las nuevas tecnologas. La necesidad de comunicarse y las demandas de acceso a los servicios de informacin independientemente del lugar o situacin han llevado a los usuarios a la utilizacin cada vez mayor de la diversidad de dispositivos de acceso a la red que hoy existe. As, en este entorno de nmadas han surgido consecuentemente una serie de desafos a solucionar. Podemos mencionar por ejemplo: Independencia de ubicacin: actualmente nos comunicamos con los individuos en funcin de su ubicacin o de sus instrumentos de comunicacin; es decir, el telfono mvil, fax, u ordenador ms cercano. Si pudiramos comunicarnos con las personas independizndonos de su ubicacin, dirigiendo de forma transparente nuestras comunicaciones al dispositivo apropiado en el lugar apropiado, esto generara entonces un ambiente en el cual las personas se comunicaran con otras personas, y no con los dispositivos que ellos usan. Independencia del dispositivo: un usuario nmada no siempre acceder a los servicios desde el mismo lugar o a travs del mismo dispositivo. De esta manera la Nomadicity deber soportar la independencia del dispositivo. Acceso de amplio espectro: un componente esencial de la Nomadicity es que los individuos permanezcan conectados tanto como ellos deseen y desde donde ellos deseen. Por esta razn, los dispositivos de comunicacin y los canales de los que dependen la conectividad deben permitir un amplio espectro de acceso. Seguridad: la Nomadicity impone requisitos de seguridad especial, particularmente con todo lo que se refiere a identificacin, certificacin, y facturacin. Puesto que el dispositivo no es la persona, la tecnologa puede ocultar la identidad de las partes que se comunican. Garantizar que el individuo conectado en un extremo de la comunicacin sea quien dice que es, es uno de los puntos crticos para establecer un acceso efectivo. Similarmente, cuando el individuo se encuentra en movimiento, cambiando de dispositivos y de ubicacin, otro gran nmero de problemas de seguridad son resaltados. Interfaz amigable: la aceptacin pblica de las nuevas tecnologas principalmente est basada en la medida en que estas tecnologas sean familiares y consistentes con otras tecnologas que son similares a otros modelos ya conocidos por los usuarios. Es el caso del xito de los telfonos mviles, en los que la imagen que el sistema presenta al usuario es familiar y muy parecida a la de los telfonos ya conocidos. Particin (Partitioning): una persona podra usar el mismo dispositivo (o conjunto de dispositivos) para acceder a sus servicios en varios ambientes personales separados.
Pagina 12
A partir de todas estas caracterizaciones referentes a un entorno de usuarios nmadas, se pone an ms en evidencia la necesidad de considerar entornos heterogneos y consecuentemente redes heterogneas. De esta forma, si nuestro anlisis parte desde el explosivo desarrollo tecnolgico; o si parte desde la necesidad de considerar los ricos contenidos multimedia existentes en la web y la necesidad de adecuarlos a las nuevas tecnologas; o desde el fenmeno de los entornos de usuarios nmades y la necesidad de adecuar la tecnologa a ellos, vemos que todos en conjunto apuntan a un mismo lugar: la necesidad de adecuar la informacin al usuario, al dispositivo y la red.
Pagina 13
A partir de esta clasificacin, pone de manifiesto, dentro de estos dos extremos, el espectro del concepto de adaptacin para sistemas de computadores, Figura 12. Si bien es cierto que, el espectro cubre un amplio rango de posibilidades existentes para el concepto de adaptacin, encontramos mucho ms adecuada la caracterizacin realizada por De Bra [BRA99] al referirse a los sistemas hipermedia adaptativos.
En [BRA99] se tiene en cuenta las preferencias del usuario como variable que decide la adaptacin, clasifica los entornos hipermedias o los sitios Web construidos con la capacidad de realizar algn tipo de personalizacin en:
Pagina 14
Hipermedias adaptables: sistemas en los que el usuario puede proveer algn perfil (por ejemplo a travs de cuestionarios) para que el sistema pueda proveer una versin de la aplicacin hipermedia teniendo en cuenta ese perfil. Esta configuracin, por parte del usuario, podra incluir preferencias de presentacin (colores, tipo de media, estilos de aprendizaje, etc.) y el background del usuario (calificaciones, conocimiento relativo a los conceptos, etc.) Hipermedias adaptativos: sistemas que monitorizan el comportamiento de los usuarios y adaptan la presentacin teniendo en cuenta dicho comportamiento. En estos casos la evolucin, tanto en preferencias como en conocimientos, podra ser captada o deducida por el sistema a partir de los accesos realizados a las pginas. Por otra parte, muchas veces podran necesitar cuestionarios o test a fin de obtener informacin ms fiable respecto a las preferencias del usuario. La mayor parte de la adaptacin es realizada, sin embargo, sobre la base de las acciones de navegacin del usuario y tambin considerando el comportamiento de otros usuarios. Hipermedias dinmicos: El comportamiento de los usuarios es monitorizado como en los sistemas hipermedia adaptativos. En este caso, la adaptacin, en lugar de ser cambiada seleccionando presentaciones predefinidas, es generada a partir de unidades atmicas de informacin. Es decir, es reconstruida dinmicamente a partir de los objetos individuales que componen la pgina tomando los que son mas adecuados en base a las caractersticas del usuario.
En el presente trabajo, nos sujetaremos a esta clasificacin por considerarla la ms adecuada y representativa de nuestras caracterizaciones.
Otro importante punto de atencin de estos workshops fue el intento de encontrar una terminologa comn para el campo del hipertexto. Difcil tarea, al carecer de abstracciones comunes entre los diversos sistemas analizados en ese momento. As por ejemplo, el trmino nodo result ser especialmente difcil de homogeneizar debido a la extrema variacin de su uso en los diferentes sistemas. De esta manera, y a fin de evitar confusin, el modelo no usa trminos conflictivos como nodo, prefiriendo trminos neutrales como componente. El modelo descrito, Figura 23, est dividido en 3 capas: 1. Runtime: describe los mecanismos para soportar la interaccin de los usuarios con el hipertexto. 2. Storage: describe los mecanismos a travs de los cuales los componentes y los enlaces estn relacionados con el fin de conformar la red de hipertexto. 3. Within-component: cubre los contenidos y estructuras internas de los componentes del hipertexto.
Capa Runtime
Presentation specifications
Capa Storage
Una Base de datos que contiene una red de nodos y enlaces
Anchoring
Capa Within-Component
El contenido / estructura dentro de los nodos
El foco principal de atencin del modelo est en la capa de storage, que modela la estructura de una red bsica del tipo nodo/enlace y representa una base de datos que est compuesta de una jerarqua de componentes contenedores de datos, los cuales estn interconectados por enlaces (links) relacionales. Los componentes contienen las porciones de texto, grficos, imgenes, animaciones, etc. que conforman el contenido bsico en una red de hipertexto. Esta capa se concentra en los mecanismos, a travs de los cuales los componentes y enlaces estn vinculados, para conformar las redes de hipertexto. Los componentes son tratados en esta capa como contenedores genricos de datos. No se modela ninguna estructura dentro del contenedor, por lo cual, la capa storage no realiza ninguna diferenciacin entre componentes de texto o componentes grficos.
Pagina 16
Por el contrario, la capa within-component del modelo se ocupa especficamente de los contenidos y estructuras internas de los componentes del hipertexto. Esta capa no est desarrollada dentro del modelo de Dexter, quedando abierta la variedad de posibles contenidos / estructuras que se pueden incluir en un componente. Texto, grficos, animaciones, simulaciones, imgenes, y cualquier otro tipo de datos han sido utilizados como componentes en los sistemas de hipertexto actuales. Por lo que resulta difcil intentar que un modelo genrico cubra todos estos tipos de datos. En su lugar, el modelo de Dexter trata la estructura dentro del componente (within-component structure) como constituida fuera del modelo. Existen dos aspectos crticos del modelo de Dexter. El primero se presenta en la interfaz entre las capas storage y within-component. Y el segundo aspecto crtico es la interfaz entre la capa storage y la capa runtime. En el primer caso, el sistema de hipertexto requiere de mecanismos para localizar la ubicacin o tem dentro del contenido de un componente individual. En el modelo de Dexter, este mecanismo es conocido como anchoring. Las capas de storage y within-component tratan el hipertexto como una estructura esencialmente pasiva. Los sistemas de hipertexto, sin embargo, van ms all de esto en el sentido de que proveen las herramientas para que el usuario pueda acceder, ver y manipular la estructura de la red. Esta funcionalidad est representada por la capa runtime del modelo. Y, como en el caso de la estructura within-component, la serie de posibles herramientas para acceder, ver y manipular las redes de hipertexto son tantas y tan diversas para ser manipuladas por un modelo genrico. Por lo tanto, el modelo de Dexter solo provee un modelo estructural y simple de los mecanismos para presentar un hipertexto al usuario para ver y editar. Esta presentacin de mecanismos captura lo esencial de la dinmica, los aspectos de la interaccin de los sistemas de hipertexto, pero no intenta cubrir los detalles de la interaccin con el hipertexto. Y as, como en el caso del anchoring, el segundo aspecto crtico del modelo es la interfaz entre la capa storage y runtime. En el modelo de Dexter esta interfaz se realiza usando la nocin de presentation specifications. Presentation specification es un mecanismo por el cual la informacin acerca de cmo un componente/red (component/network) es presentado al usuario puede ser codificada dentro de la red de hipertexto en la capa de storage. Por lo tanto, la forma en la cual un componente es presentado al usuario puede ser una funcin no slo de la herramienta de hipertexto especfica, que est haciendo la presentacin (por ejemplo la capa runtime especfica), sino que puede ser tambin una propiedad del componente mismo y/o del camino de acceso (enlace link) dado para ese componente. En la Figura 3, [HAL94]4, se ilustra la importancia de los mecanismos de presentation specifications. Este ejemplo pone de manifiesto tambin la utilidad del modelo como representacin de un entorno adaptativo, ya que, sobre la base del perfil del usuario muestra la informacin de una u otra manera. En la figura, observamos un componente de animacin existente en una computadora de entrenamiento de hipertexto. La animacin puede ser accedida desde dos componentes. Un componente teacher y otro componente student. Cuando la animacin es accedida a travs del enlace del componente student, esta animacin debe ser ejecutada como tal. En caso de ser accedida por el componente teacher, la animacin debera ser lanzada en modo de edicin para poder ser modificada. Con el objetivo de separar los dos casos, la capa runtime necesita acceder a la informacin de presentacin codificada dentro del enlace en la red. Las presentation specifications son una forma genrica de hacer justamente esto. As como vimos con el anchoring,
Pagina 17
presentation specifications es una interfaz que permite a la capa storage comunicar en una forma genrica con la capa runtime sin violar la separacin entre las dos capas.
Figura 3 Ilustracin de la necesidad de presentation specifications en el camino de acceso (enlaces) as como en los componentes mismos.
Por ltimo, a travs de la Figura 45, se intenta mostrar como varias capas del modelo de Dexter estn representadas dentro de un sistema de hipertexto tpico. La figura describe una red de hipertexto de 3 nodos y 1 enlace. La capa de storage contiene 4 entidades: los tres componentes (nodos) y el enlace. Los contenidos (texto y grficos) para los componentes estn localizados a la derecha de la capa de storage en la capa withincomponents. En la capa runtime, el componente de grficos est siendo presentado al usuario. El enlace es lanzado desde este nodo a travs del puntero de la pantalla del ordenador.
Figura 4 Descripcin de tres capas del modelo de Dexter implcitas en un sistema de hipertexto real
Pagina 18
La arquitectura planteada por [MA00] se muestra en la Figura 56 y est constituido por tres mdulos principales: 1. Mdulo de Caracterizacin del Usuario-Cliente-Red (User/client/network-discovery) 2. Motor de Decisin (Decision Engine) 3. Algoritmos para la Adaptacin de Contenidos (Content adaptation algorithm)
Pagina 19
Figura 5 Marco de trabajo bsico para el Sistema de entrega de contenido adaptativo de [MA00]
El Mdulo de Caracterizacin del Usuario-Cliente-Red es el encargado de detectar y coleccionar la informacin que el Motor de Decisin necesita conocer a fin ejecutar un algoritmo de adaptacin de contenidos en particular. En este esquema, el Motor de Decisin es el centro fundamental del sistema y las caractersticas a definir son puntualizadas en forma clara a travs de la Figura 67 Ahora bien, dependiendo donde el Motor de Decisin y los algoritmos de adaptacin de contenidos estn ubicados, [MA00] enuncia las siguientes arquitecturas para el sistema: Adaptacin basada en Servidor: Aqu el servidor es el responsable de la deteccin de las capacidades del cliente y de las caractersticas de su ancho de banda disponible. Basndose en esto decide la mejor estrategia de adaptacin a seguir. Esta arquitectura tiene la ventaja de permitir tanto una adaptacin de contenidos esttica (off-line) o una dinmica (on-the-fly). Adaptacin basada en Proxy. Aqu el cliente se conecta a un proxy que hace la peticin al servidor como un intermediario. El proxy intercepta la respuesta del servidor, decide y ejecuta la adaptacin y enva el contenido transformado al cliente. En este caso se considera que el ancho de banda entre proxy y servidor es mucho mayor que entre cliente y proxy, por lo cual el tiempo de recuperacin del contenido original desde el servidor al proxy es insignificante.
Con respecto a las tcnicas de adaptacin consideradas en este trabajo, se mencionan cinco tecnologas de procesamiento para realizar una entrega de informacin inteligente: 1. Information abstraction. Su objetivo es reducir el ancho de banda requerido para la entrega del contenido, a travs de una compresin de datos y conservando la informacin de alto valor para el usuario, por ejemplo, resumiendo texto, generacin de imgenes pequeas, etc.
Pagina 20
Figura 6 Listado de los parmetros de entrada y los algoritmos de salida alrededor del Motor de Decisin de [MA00].
2. Modality transformation. Es el proceso de transformacin de contenidos de modo a otro, de modo tal que el contenido resulte til para un cliente particular. El objetivo principal de esta tcnica es adaptar la representacin contenidos a las capacidades del cliente, por ejemplo, transformar video en conjunto de imgenes.
un en de un
3. Data transcoding. Es el proceso de conversin del formato de datos de acuerdo a las capacidades del cliente, por ejemplo, convirtiendo el formato de las imgenes GIF a JPEG, o de color a una escala de grises, o formato de audio WAV a MP3, o formato de un documento Postscritp a PDF, etc. 4. Data Prioritization. Tiene como objetivo distinguir la parte ms importante del dato menos importante, tal que, diferentes niveles de calidad de servicio pueden ser provistos cuando se entregue el dato a travs de la red, por ejemplo, dejar
Pagina 21
de lado los datos menos importantes ante condiciones de restriccin de ancho de banda. 5. Purpose Classification. Los contenidos de las pginas Web tpicas contienen mucha informacin y objetos media que son redundantes o podran ser de poco inters para el usuario. La tcnica propone clasificar la entrega de informacin removiendo los objetos redundantes o priorizndolos de acuerdo a su grado de importancia. Finalmente, nos queda mencionar de este trabajo las metodologas consideradas para la definicin de las preferencias del usuario, las capacidades del cliente, y las caractersticas de la red. Estas son: Anlisis de la peticin. La informacin contenida en la cabecera de la peticin http, ha sido considerada por informacin que puede recuperarse a partir de sta sobre el dispositivo del cliente. En [MA00] se seala el estndar que est desarrollando la World Wide Web Consortium (W3C) para los procesos de definicin de las capacidades del cliente y preferencias del usuario [W3C99-1]. Sesiones de ratreo (Tracking sessions). Utiliza el conjunto de herramientas dado por el UserAgent String transmitido por el navegador, la direccin IP, y una cookie opcional para establecer un identificador (ID) para el usuario que es mantenido durante la sesin. Mediciones automticas. En el servidor son ejecutadas dinmicamente mediciones a fin de obtener informacin relativa a la carga y el ancho de banda del sistema. Recomendacin del usuario. Utilizan una interfaz para que el usuario enve informacin relativa a sus preferencias, capacidades del dispositivo y tipo de acceso a la red que utiliza. Esta informacin la enva al servidor a travs de un formulario insertado en una pgina Web. Anlisis del comportamiento de navegacin del usuario. Analizando los logs del servidor se obtiene informacin sobre las preferencias del usuario.
[MA00] es un trabajo muy amplio y completo en el campo de la entrega de contenidos adaptados. En el mismo se considera casi todas las caractersticas mencionadas y a tener en cuenta a la hora de una adaptacin. En concreto, las preferencias del usuario, las caractersticas del dispositivo y el estado de la red. Sin embargo, no hay una clara referencia al hecho de que considere el estado de carga del servidor que en nuestra propuesta, es una clave fundamental a la hora de implementar una adaptacin dinmica (como se ver ms adelante). De todas formas, este trabajo mereca ser expuesto en detalle por las caractersticas generales que plantean en su marco de trabajo.
Contenidos voluminosos de informacin son clasificados a fin de adaptarse a las preferencias de los usuarios y condensados para mostrarse mejor sobre pequeos dispositivos con conexiones lentas. [YAN00] enfoca su trabajo sobre dos reas: 1. Nuevos algoritmos para extraer los contenidos estructurales de las pginas web, y 2. Tecnologas de sistemas para construir servicios de entrega de contenidos adaptativos. La arquitectura del sistema planteado se muestra en la Figura 78 y podemos observar los siguientes mdulos: Discovery&Profile Database. Agente auto-mejorado (self-improved agent) que recoge y mantiene informacin de los clientes, el sistema y la red. Content Adaptation. Formado por los filtros para convertir, resumir y sustituir contenidos. Layout & Format. Organiza y genera los contenidos finales para ser entregados. Cache Manager. Almacena frecuentemente los resultados de la adaptacin utilizada para el rendimiento del proceso.
Se observa en el sistema un mdulo denominado Content Parser que es el encargado de recabar la informacin estructural de las pginas HTML. Para ello utiliza un algoritmo de anlisis a fin de extraer los contenidos y sus propiedades de apariencia y posteriormente intenta generar grupos de objetos. El Decision Engine (Motor de Decisin) decide que contenidos, con que apariencia y en que forma sern enviados al usuario final. Es este ultimo el que, a su vez, colecta informacin del usuario/dispositivo/red a partir de los otros mdulos.
Pagina 23
En [CHE00] este grupo presenta su AWCD Adaptive Web Cotent Delivery. Una propuesta para proveer un servicio Web personalizado y adaptativo para clientes. Con AWCD, el usuario web puede obtener el contenido ms apropiado a su dispositivo y a sus preferencias, al mismo tiempo que minimiza el consumo del ancho de banda. La arquitectura bsica de AWCD se muestra en la Figura 89 y est formada por dos subsistemas: Client Profile Learning. Analiza el entorno del cliente Adaptation. Ejecuta las decisiones de adaptacin y genera un nuevo contenido web.
El subsistema Client Profile Learning, basndose en una estructura tpica de Internet, realiza la siguiente separacin de las caractersticas a fin de describir la variacin del entorno del cliente: Las Caractersticas de la Red (Network Characteristics): ancho de banda de la red, retardo, tasa de error y tasa de congestin. Mdulo del Procesador (Processor Module): capacidades de hardware y tipo de software. Interfaz de Usuario (User Interface): dispositivos de entrada/salida y tipo de navegador. Preferencias del Usuario (User Preference): tiempo de espera aceptado, las preferencias de contenido, las preferencias de tipo de media, las preferencias de entrega, la presentacin , etc.
Pagina 24
A continuacin vamos a realizar una resea de algunos trabajos de investigacin desarrollados en este campo. Se describiren las tcnicas de adaptacin utilizadas y se resaltan las caractersticas de cada uno de ellos con el objetivo de tratar de encontrar los patrones comunes que los rigen.
10
Se utilizar la sigla en ingls AHS (Adaptive Hypermedia Sistem- Sistema Hipermedia Adaptativo) por estar muy generalizado su uso dentro de los ambientes de investigacin de los entornos hipermedia adaptativos.
Pagina 25
La adaptacin, segn [BRA99], puede ir desde una simple seleccin (automtica) entre diferentes versiones de algunas pginas de informacin, hasta una completa generacin dinmica de todas las pginas a partir de unidades atmicas de informacin y de todos los links de hipertexto. En [BRA99-1] hace una distincin entre las siguientes tcnicas de adaptacin: adaptacin de contenidos (content-adaptation) y adaptacin de enlaces (link-adaptation); que por otra parte, BRU96] las denomina como Presentacin Adaptativa (adaptive presentation) y Navegacin Adaptativa (adaptative navigation).
3.2.1.1
Podra ser deseable presentar la informacin sobre ciertos temas en diferentes formas, dependiendo de los (pre)conocimientos, objetivos, preferencias u otras propiedades caractersticas del usuario. As, podran ser agregadas introducciones bsicas para los usuarios noveles o material avanzado para los expertos. Una explicacin podra existir en diferentes versiones, para usuarios con diferentes conocimientos. El orden, en el cual los tem son mostrados en una pgina, podra ser tambin diferentes para los diferentes usuarios. De Bra distingue, en el nivel de mtodos de adaptacin, tres mtodos: Explicaciones adicionales, de prerrequisitos y comparativas. Variaciones de explicacin Clasificacin (contenidos)
Brusilovsky [BRU96] menciona las siguientes tcnicas para adaptacin de contenidos: Texto condicional Expansin de texto (stretchtext) Variaciones de fragmentos Variaciones de pginas Tcnicas basadas en fragmentos.
3.2.1.2
La idea bsica de una adaptacin de enlaces es cambiar o anotar la rica estructura de enlaces de forma que el usuario sea guiado hacia la informacin relevante y de inters, y liberarlo de la informacin sin importancia. La adaptacin de enlaces intenta simplificar la estructura de enlaces y as reducir los problemas de orientacin, manteniendo una gran libertad en la navegacin. Los mtodos de adaptacin definidos son: Gua a nivel global o local. La gua es ofrecida indicando que enlaces son preferidos sobre otros. Soporte de orientacin global o local. Depende del contexto que provee. Este requiere algn mapa (posiblemente textual) de la estructura de enlaces alrededor del nodo actual (pgina).
Pagina 26
.Las tcnicas consideradas para una adaptacin de enlaces son [BRU96] [BRA98]: Gua directa (por ejemplo, un botn Siguiente) Clasificacin de enlaces (como en los motores de bsqueda) Ocultacin de enlaces (oculta los enlaces no relevantes, pero mantiene el texto anclado) Anotacin de enlaces (por ejemplo, uso de colores para indicar la relevancia) Deshabilitar enlaces (inutilizar los enlaces no relevantes) Remocin de enlaces (remover los enlaces no relevantes) Adaptacin de mapas (proveer vistas personalizadas)
De hecho no existen AHS que soporten todos los mtodos y tcnicas descriptas anteriormente. El uso de todas las tcnicas de adaptacin en forma simultnea nos conducira a un sistema poco utilizable. Sin embargo, en los sistemas futuros el diseador debera ser capaz de seleccionar las tcnicas deseadas y obtener un sistema que soporte cada opcin. Brusilovsky [BRU01] muestra de manera muy explcita la taxonoma actualizada para las tecnologas hipermedia adaptativas como se muestra en la Figura 911, la cual es una interesante representacin de lo expuesto anteriormente.
3.2.1.3
AHAM (Adaptive Hypermedia Application Model): Modelo de Referencia para Hipermedia Adaptativa basado en el Modelo de Dexter
El modelo de Dexter ha sido ampliamente utilizado para la representacin de los sistemas hipertexto/hipermedia. Como seala [BRA99-1], el modelo describe una arquitectura mucho ms poderosa en algunas reas que cualquier sistema hipermedia actual. El modelo de Dexter, es sin duda el modelo de referencia ms usado, siendo an el ms apropiado para modelar la mayor parte de las aplicaciones hipermedia. [BRA99-1] presenta AHAM, un modelo de referencia para aplicaciones hipermedia adaptativas, que encierra la mayora de las caractersticas soportadas por los sistemas adaptativos que hoy existen o que estn siendo desarrollados. En AHAM se describen los AHS mediante el uso de una terminologa conocida y genrica. Para esto, intenta acomodar la hipermedia adaptativa dentro del modelo de Dexter a fin de caracterizar y comparar los diferentes AHS. Mediante esta formalizacin de los AHS como sistemas hipermedia basados en el modelo de Dexter, muestra tambin como relacionar las tcnicas adaptativas dentro de dicho modelo. Por otra parte, provee las bases para el desarrollo de los nuevos AHS. Para ello, realiza una clara distincin de algunos conceptos a menudo confundidos y mezclados. Estos son:
11
Pagina 27
Adaptive presentation
Adaptation of modality
Stretchtext
Sorting fragments
Dimming fragments
Direct guidance
Hiding
Disabling
El modelo del dominio (domain model). Describe como la informacin es estructurada y enlazada. Esto corresponde en lneas generales a la capa de storage del modelo original de Dexter. El modelo del usuario (user model). Describe cual es la informacin del usuario que el AHS conservar como registro permanente. Esto incluye la representacin del conocimiento que el usuario obtiene y un registro de los nodos visitados por el usuario. El modelo de aprendizaje (teaching model). Consiste en reglas pedaggicas que definen como el modelo del dominio y el modelo del usuario son combinados para proveer los caminos para ejecutar la adaptacin en curso. Se aclara en este punto que el trmino enseanza y pedaggico no implican que AHAM pudiera ser til solamente para AHS usados en aplicaciones educativas. Un motor adaptativo (adaptative engine). Ejecuta la adaptacin en curso adaptando o generando dinmicamente el contenido de los nodos y el destino y clase (class) de los enlaces a fin de guiar cada usuario individual de forma diferente.
Ahora bien, en las aplicaciones hipermedia el nfasis siempre est en el contenido de la informacin (nodos) y en la estructura de enlaces. El modelo de Dexter confirma esto concentrndose sobre lo que llama la capa storage.
Pagina 28
En los AHS la funcin principal del modelo del dominio est compartida con el modelo de usuario. Un modelo del usuario representa como los usuarios se relacionan con el modelo del dominio. El dominio de la aplicacin negocia con un cierto nmero de conceptos. El modelo del usuario est al tanto de cuanto conoce el usuario sobre cada uno de los conceptos del dominio de la aplicacin. A fin de ejecutar la adaptacin basada sobre el modelo del dominio y el modelo del usuario se especifica como los conocimientos del usuario tienen influencia sobre la forma en que la informacin, desde el modelo del dominio, es presentada. Esto se hace por medio del modelo de enseanza que est constituido de reglas pedaggicas. Las reglas son utilizadas por un motor adaptativo con el fin de generar lo que en el modelo de Dexter se denomina presentation specifications. La Figura 1012 muestra el modelo de AHAM como una extensin del modelo de Dexter. Al igual que en este ltimo, AHAM pone su atencin sobre la capa storage, anchoring y presentation specifications. En Dexter la nocin principal de la capa de storage es el componente. Esta nocin cubre tanto nodos como enlaces. En hipermedia adaptativa las nociones principales son los conceptos y la relacin de conceptos.
3.2.2 MAS-PLANG
MAS-PLANG (MultiAgent System PLANG13) es un sistema multiagente desarrollado para transformar el entorno educativo virtual de las USD (Unitats de Suport a la Docncia) en un AHS, teniendo en cuenta los estilos de aprendizaje del alumno [PE02], [PE02-1], [PE02-2].
12
Es un proyecto del grupo BCDS Broadband Communications and Distributed System de la Universitat de Girona para la "Implementacion y estudio de una plataforma telematica de nueva generacin para el soporte de enseanza abierta y a distancia (PLAN-G PLAtaforma de Nueva Generacin" )
13
Pagina 29
Este proyecto es otro ejemplo de la adaptacin de contenidos a partir de las caractersticas y/o preferencias del usuario. En este caso, las tcnicas de adaptacin estn dirigidas a la seleccin personalizada de los materiales didcticos, las herramientas de navegacin y las estrategias de navegacin del entorno educativo de acuerdo al estilo de aprendizaje del estudiante. Estamos hablando por consiguiente de adaptacin de contenidos y adaptacin de enlaces, al igual que se ha planteado en el apartado referido a De Bra y Brusilovsky. Con el fin de realizar el modelado del estudiante utilizan tcnicas de Inteligencia Artificial. El sistema tiene la capacidad de categorizar a los estudiantes de acuerdo a su habilidad de procesar, percibir, recibir, organizar y entender la informacin. El MAS-PLANG [PE02] modela al estudiante mediante la interaccin de sus agentes monitores, con los agentes del entorno del HabitatPro [HPR01], una herramienta diseada para la personalizacin de contenidos y sondeo de mercados utilizando tcnicas de Razonamiento Basado en Casos y Reglas de Lgica Difusa. Esta sistema se ha construido sobre una plataforma multiagente compatible con los estndares de FIPA [NOR00] utilizando lenguajes de programacin como el Java, JavaScript, Flash y XML. Ha sido diseado con el objetivo de ofrecer caractersticas de adaptatividad a la plataforma educativa USD [FAB00] utilizada para el soporte a la educacin a distancia a travs de la web, basndose en los estilos de aprendizaje,. Actualmente, la plataforma educativa USD, es un sistema adaptable que permite a los profesores crear y mantener unidades docentes navegables de forma secuencial o libre. Un conjunto de pginas HTML, que contienen material educativo utilizado para dar soporte a la enseanza, son agrupados formando una unidad docente. Por otra parte, permite al estudiante configurar su entorno de aprendizaje teniendo en cuenta sus preferencias en aspectos tales como tamao, forma y posicin de los conos, barras de navegacin, idioma del entorno, etc. La USD realiza una interesante separacin de lo que es estructura y contenido, permitiendo una reutilizacin de una misma pgina HTML en diferentes unidades docentes y la creacin de una sola estructura para el acceso a una misma unidad docente en diferentes idiomas. Esto se muestra claramente en la Figura 1114, en la que se representa un conjunto de pginas HTML, a travs de los nodos A-1 a C-2 y las estructuras de navegacin (e-1, e-2 y e-3). La figura muestra claramente, como al modificar la pgina representada por el nodo B-1, sta se modifica automticamente en todas las unidades docentes que la utilizan.
14
Pagina 30
Si bien es cierto, hacen uso de la interaccin con el usuario, plantean una solucin global y fuera de lnea (off-line) para la optimizacin y adecuacin del sitio web teniendo en cuenta el comportamiento del usuario. Por este motivo vamos a describir las conceptualizaciones realizadas por este grupo de investigacin. El problema de un buen diseo en un sitio web se debe a diversos factores: Acceden diferentes visitantes con distintos objetivos El mismo visitante podra buscar diferente informacin en diferentes momentos Muchos sitios web aumentan su diseo original acumulando enlaces y pginas en diversos lugares Un sitio podra estar diseado para un uso en particular, pero ser usado en la prctica de diferentes formas, por lo cual las expectativas del diseador podran ser violadas a priori.
Muy a menudo los diseos de sitios web son estructuras fosilizadas en HTML, mientras que la navegacin web es dinmica, dependiente del tiempo y de la idiosincrasia de los individuos. En [PER98] ya se plantea que los sitios web pueden ser adaptados bsicamente de dos maneras: Personalizacin (Customization). Adaptando la presentacin del sitio a las necesidades de los visitantes en forma individual, basndose en la informacin personal de cada uno de ellos. Optimizacin (Optimization). Mejorando la estructura del sitio basndose en la interaccin de todos los visitantes.
Basndose en esta clasificacin, proyectan su investigacin a partir de la optimizacin de un sitio web. La metodologa para la adaptacin del sitio web est motivada por cuatro objetivos fundamentales [PER98]: 1. Impedir el trabajo adicional a los visitantes (por ejemplo llenar cuestionarios). 2. Hacer el sitio web muy fcil de usar para todos.
Pagina 31
3. Usar los sitios web como estn. 4. Proteger el diseo original del sitio de cambios destructivos. Esto significa, aplicar solamente transformaciones no destructivas: es decir, cambios al sitio web que dejen la estructura existente intacta: agregar enlaces pero no removerlos, crear pginas pero no destruirlas, agregar nuevas estructuras pero no confundir las existentes. Posteriormente, a partir de los logs de acceso al servidor, el sitio decide cuando y donde ejecutar estas transformaciones. Page synthesis es la creacin automtica de pginas web. Perkowitz y Etzioni proponen la creacin de nuevas pginas ndices (index page), es decir, pginas que contienen enlaces a pginas de sitios referentes a un tpico en particular. Basndose en esto define el Problema de Sntesis de Pginas ndices (Index Pages Synthesis Problem) [PER98] de la siguiente manera: dado un sitio web y el log de acceso de los visitantes, crear nuevas pginas ndices que contengan las colecciones de enlaces a las pginas relacionadas pero actualmente no enlazadas. Ntese que, generalmente un sitio web est restringido a una coleccin de pginas HTML residentes en un servidor nico. Un log de acceso es un documento que contiene una entrada para cada peticin respondida por el servidor web. Cada peticin lista, al menos, el origen de la peticin (direccin IP), la URL peticionada y el instante en que realiz de la peticin. Las pginas relacionadas pero no enlazadas son pginas que comparten un tpico comn pero que no estn actualmente enlazadas con el sitio. Perkowitz y Etzioni presentan as, una nueva metodologa para el clustering (agrupamiento), denominada cluster mining, e introducen el PageGather, un algoritmo de sntesis de contenidos de pginas ndices. Dado un gran log de acceso, la tarea es encontrar una coleccin de pginas que tienda a ser concurrentemente visitada. El cluster mining es una variacin del clustering tradicional. As, en lugar de dividir el espacio total de los documentos, encuentran un nmero pequeo de clusters de alta calidad. Ms an, mientras que el clustering tradicional se ocupa de ubicar cada documento exactamente en un cluster, el cluster mining puede colocar un documento nico en mltiples y solapados clusters. El algoritmo PageGather usa el cluster mining para encontrar la coleccin de pginas relacionadas a un sitio web, basndose en la suposicin de la coherencia de las visitas realizadas al sitio. La metodologa propuesta por Perkowitz y Etzioni es interesante de tener en cuenta durante la optimizacin y adecuacin de los contenidos de los sitios web. Como se expuso, lo hace basndose en la interaccin con el usuario, haciendo uso de los logs de acceso que se generan en el servidor. Y, a partir de tcnicas de Inteligencia Artificial, plantea un algoritmo para la generacin de los nuevos ndices de pginas con una temtica determinada. Lo ms interesante de la propuesta es que, efectivamente no est modificando los contenidos tal y como han sido elaborados por sus autores. La optimizacin del rendimiento est apuntado a la navegacin general del sitio, sin tener en cuenta los aspectos individuales del usuario. En otros tipos de propuesta el sitio web es transformado dinmicamente, la informacin es personalizada para cada usuario basndose en un modelo de usuario y este modelo es estructurado sobre la base de la informacin recabada de las acciones previas del visitante. A diferencia de estos, la metodologa propuesta por Perkowitz y Etzioni realiza cambios (offline) del sitio entero visibles para todos los visitantes y no necesita peticiones o requerimientos de informacin de los visitantes en forma individual.
Pagina 32
El sistema durante la primera sesin del usuario intenta construir su modelo de usuario. Para esto, y a fin de construir dicho modelo de una forma fiable, utiliza cuestionarios para ser respondidos por el usuario, en los cuales expresa su grado de inters respecto a las
15
Pagina 33
categoras del dominio. Estas respuestas son utilizadas posteriormente para realizar el filtrado de la informacin. Vemos una vez ms, como a travs de las caractersticas y/o preferencias del usuario, esta vez explicitadas a travs de cuestionarios directos, se realiza una adecuacin de los contenidos a mostrar. En este caso, esta adecuacin se realiza a travs de un filtrado de la informacin y las metodologas para implementar este proceso se realiza a travs de tcnicas de RBC.
Pagina 34
Pagina 35
Pagina 36
el contenido multimedia que usa MPEG-716. La Conversin de los objetos multimedia (Media Coversion) o trascodificacin es la parte que adapta el contenido a las diferentes capacidades del cliente. Esta conversin como dijimos, puede realizarse antes de la peticin del cliente o durante la peticin. El objetivo de UMA es proveer una interfaz perfectamente integrada entre el mundo cableado y el inalmbrico. Esto lo realiza de manera transparente para el cliente, considerando las capacidades de su dispositivo y mantenindolo conectado independientemente del punto de acceso; proveyndole de esta forma de la movilidad que necesita. Es decir, negocia la entrega de imgenes, video, audio y contenido multimedia bajo diferentes condiciones de red, preferencias de usuario y las capacidades del dispositivo de acceso. A pesar del hecho de tomar en cuenta cuestiones tales como las condiciones de la red y/o preferencias del usuario, la mayor motivacin de este proyecto se concentra en posibilitar a los terminales con capacidades limitadas (de comunicacin, procesamiento, almacenamiento y visualizacin) acceder a los contenidos multimedia disponibles. UMA presenta de esta manera, una solucin para que tanto los clientes cableados como los inalmbricos accedan a los mismos contenidos de un servidor, recibiendo cada uno el contenido adecuado a las capacidades del cliente. Actualmente dispone de un test-bed (banco de prueba) que ha sido desarrollado y es usado para el chequeo de los esquemas de descripcin (Description Schemes) del MPEG-7 y su acondicionamiento para sistemas de telecomunicaciones. Los se realizan considerando tres tipos de conexin: 56 Kbits/s, 2 Mbits/s y 10 Mbit/s; realizando la conversin de los objetos media a travs de la extraccin de cuadros (key frame extraction), trascodificacin y descripcin de contenidos usando el MPEG7 Media TranscodingHint Description Scheme. MPEG-7 propone un nmero de Description Schemes (DSs), especficos para la descripcin del contenido multimedia, diseados para manejar diferentes variaciones del material multimedia y describir los requerimientos de sus recursos. En la figura 1317 se muestra el testbed utilizado en el proyecto UMA.
16
el objetivo del estndar MPEG-7, formalmente denominado "Multimedia Content Description Interface", es proveer un basto conjunto de herramientas estandarizadas para describir los contenidos multimedia.
Figura extractada de [APER01-1]
17
Pagina 37
El desafo fundamental en la computacin nmada es la adaptacin dinmica en la trada servicio-terminal-conectividad. La arquitectura de agentes inteligentes de MONADS y los
18
Pagina 38
servicios de dicho sistema es una posible solucin de los desafos impuestos en el problema de la nomadicidad [MIS99-1][MIS00][KOS00][CAM99][CAM00].
3.3.3 InfoPyramid
En [SMI99] se pone nuevamente de manifiesto la problemtica surgida a partir de la consideracin de los nuevos dispositivos de acceso utilizados en Internet. Esta creciente incompatibilidad entre las capacidades de acceso y proceso de la informacin de esta nueva clase de dispositivos - pervasive computing devices y los contenidos multimedia disponibles es el punto de concentracin de la propuesta realizada por este proyecto. La Figura 1519 muestra el sistema para la entrega de multimedia escalable para dispositivos pervasive computing propuesto en [SMI99].
A fin de representar los objetos media que constituyen los documentos multimedia, utilizan el modelo de datos denominado InfoPyramid [SLI98], Figura 16. El InfoPyramid maneja las diferentes variaciones de los objetos media con diferentes modalidades y fidelidades. La escalabilidad de la entrega de multimedia se consigue a travs de: Almacenamiento, gestin, seleccin y entrega de diferentes versiones de los objetos media en la InfoPyramid, a fin de adaptar los documentos multimedia al dispositivo del cliente [MOH99] Manipulando los objetos media en tiempo real (on-the-fly), utilizando mtodos tales como trasformacin text-to-speech, trascodificacin de imagen, y generacin de resmenes [SMI98].
InfoPyramid provee un marco general de trabajo para gestionar y manipular los objetos media. Como se representa en la Figura 16, InfoPyramid maneja diferentes variaciones de los objetos media con diferentes modalidades (video, imagen, texto y audio) y diferentes fidelidades (resumidos, comprimidos, y variaciones escaladas). Tambin provee y gestiona los mtodos de trasformacin y resumen que generan las diferentes variaciones de los objetos. Cada objeto est representado por celdas en el InfoPyramid y la posicin sobre la columna correspondiente representa su grado de fidelidad. As por ejemplo, la celda inferior izquierda corresponde a video de alta resolucin. Las celdas que se encuentran por encima de esta
19
Pagina 39
ltima, corresponden a alternativas de video de menor resolucin o comprimidas. Lo mismo ocurre con el resto de los objetos correspondientes a imagen, texto o audio.
Finalmente, la entrega contenidos multimedia a dispositivos pervasive computing se realiza de dos maneras: Entrega adaptativa (adaptive delivery). El servidor de contenidos usa la InfoPyramid para administrar y seleccionar las diferentes variaciones de los objetos media. Cuando el dispositivo del cliente peticiona un documento multimedia, el servidor selecciona y entrega la variacin ms apropiada del objeto. La seleccin la realiza teniendo en cuenta las capacidades del cliente, como tamao de la pantalla, la resolucin de colores, el ancho de banda de la red, la capacidad de almacenamiento del cliente, etc. Trascodificacin multimedia. Se realiza una transformacin en tiempo real de los objetos media teniendo en cuenta las capacidades del dispositivo del cliente. A fin de conseguir la mejor adaptacin, han diseado un sistema de encaminamiento dinmico que realiza un balance entre demora y distorsin del camino de trascodificacin seleccionado.
3.3.4 Digestor
En [BIC99] se plantea tambin el problema de las pginas Web cuyo diseo solo ha tenido en cuenta su visualizacin sobre ordenadores de escritorio que cuentan con resoluciones de monitor de 640x480 o ms. Esta desconexin, entre diseo y disponibilidad del rea pantalla disponible sobre los dispositivos mviles, conduce a una presentacin de pginas web antiesttica, incmoda, poco navegables y en el peor de los casos completamente ilegibles. Digestor toma como punto central de su trabajo el problema de cmo mostrar pginas Web, que han sido diseadas para ordenadores de escritorio, sobre dispositivos de acceso con capacidades de visualizacin ms limitadas. Digestor es un sistema de software que automticamente reescribe los documentos Web para mostrarlos apropiadamente sobre dispositivos con pantallas pequeas, tales como PDAs y telfonos mviles, proveyndolos as de un acceso independiente a la red. Esta es otra muestra de los intentos de adaptacin de la entrega de contenidos teniendo en cuenta las capacidades del dispositivo del cliente. En general, como remarca [BIC99], hay 4 metodologas para la visualizacin de pginas WWW sobre dispositivos con pantallas pequeas: 1. Diseo especfico para el dispositivo (Device-specific authoring). Implica el diseo de un conjunto de pginas Web para un dispositivo de visualizacin particular. La filosofa bsica de esta metodologa es que el usuario de tales dispositivos solo podr acceder
Pagina 40
a un conjunto exclusivo de servicios, y las pginas de estos servicios son diseados particularmente para el tipo de pantalla de ese dispositivo. 2. Diseo para mltiples dispositivos (mltiple-device authoring). Un espectro de dispositivos especficos es identificado y mapeado desde un nico documento fuente a un conjunto de documentos dados, a fin de cubrir el espectro de dispositivos. Un ejemplo muy sencillo de este tipo de diseo son las hojas de estilo del HTML (CSS Cascading Style Sheets). En una CSS, una nica hoja de estilo define un conjunto de atributos de visualizacin para diferentes porciones de la estructura del documento. 3. Navegacin desde el lado del cliente (client-side navigation). El usuario tiene la capacidad de navegar interactivamente un nico documento web cambiando la seccin que est visualizando en un dado momento. Un ejemplo muy trivial de esto es el uso de las barras de desplazamiento sobre el rea de un documento. 4. Rediseo automtico (automatic re-authoring). Implica el desarrollo de software que pueda tomar un documento Web, las caractersticas de visualizacin del dispositivo y redisear el documento a travs de una serie de transformaciones para que pueda ser visualizado apropiadamente sobre el dispositivo. Este proceso puede ser ejecutado sobre el cliente, sobre el servidor o sobre un servidor proxy http intermedio. Hay muchas tcnicas de re-authoring las cuales pueden ser categorizadas en dos dimensiones: sintctica vs. semntica y transformacin vs. supresin. Las tcnicas sintcticas operan sobre la estructura de la pgina, mientras que las tcnicas semnticas se sustentan en la comprensin del documento. Las tcnicas de supresin bsicamente remueven alguna informacin, dejando todo lo otro sin tocar, mientras que las tcnicas de transformacin implican la modificacin de algunos aspectos de la presentacin de la pgina o de su contenido. En el diseo de Digestor existen dos elementos principales: una coleccin de tcnicas individuales de re-authoring, que transforman los documentos en diversas formas y un sistema automatizado de re-authoring que implementa una estrategia de diseo que selecciona la mejor combinacin de tcnicas para el par documento / tamao de pantalla.
Pagina 41
3.4.1 CAIDA
CAIDA [CAI02] - Cooperative Association for Internet Data Anlysis - del Supercomputer Center de la Universidad de California, San Diego, es un interesante referente en el rea de desarrollo de herramientas para el anlisis y mantenimiento robusto de la infraestructura de Internet. De las lneas de investigacin de CAIDA podemos mencionar dos: NGI (Next-Generation Internet). Centrado en el monitoreo, descripcin y prediccin del comportamiento del trfico de redes, a travs del desarrollo y explotacin de herramientas para una mejor ingeniera y operacin de redes. BW-EST (Bandwidth Estimation). Proyecto financiado por DOE (Department of Energy) como parte de su programa de Descubrimiento Cientfico a travs de Computacin Avanzada (Scientific Discovery through Advanced Computing SciDAC). En el mismo se aborda la problemtica relativa al estudio de las
Pagina 42
caractersticas hop-by-hop y end-to-end de las redes. Asimismo, investigan los mecanismos para la incorporacin de metodologas para la estimacin del ancho de banda desde aplicaciones u sistemas operativos, para que las aplicaciones rpidamente encuentren el throughput ms alto que el enlace puede proveer. En [CLA99] se realiza una interesante clasificacin sobre los tipos de mediciones para redes agrupndolas en: pasivas y activas. Las mediciones pasivas dependen totalmente de la presencia de un trfico apropiado sobre redes bajo estudio y tienen la significante ventaja de que pueden ser realizadas sin afectar el trfico transportado por la red en cuestin durante el perodo de la medicin. Mientras que, las mediciones activas directamente prueban las propiedades de la red generando el trfico necesario para realizar la medicin. Esto permite mtodos de anlisis mucho ms directos, pero tambin presentan el problema de que el trfico medido puede tener un impacto negativo sobre el rendimiento recibido por otros tipos de trfico. [CLA99-1] realiza un resumen interesante de algunas de las aplicaciones desarrolladas en CAIDA. As, clasifica las aplicaciones para recoleccin, anlisis y visualizacin de los datos de trfico de Internet en cuatro grupos: Topologa de red (network topology). Describe la infraestructura de enlaces de la red sobre una serie de capas de protocolos. Carga de trabajo (workload). Estas mediciones involucran la recoleccin de la informacin de trfico desde un punto dentro de la red, por ejemplo, los datos colectados por un router o switch o por un dispositivo independiente monitoreando pasivamente el trfico. Rendimiento (performance). Implica la introduccin de trfico dentro de la red a fin de monitorear el retardo entre terminales especficos de la red. Encaminamiento (routing). Incluye datos desde las tablas de encaminamiento el Border Gateway Protocol (BGP), las cuales reflejan el trnsito entre canales de proveedores de servicio en un momento dado.
Skitter, Mantra, CoralReef, iffinder, cflowd [CAI02] son algunas de las aplicaciones que podemos mencionar, desarrolladas dentro de CAIDA, que muestran la capacidad de recoleccin y anlisis de datos que poseen. Se observa as, por un lado la importancia de la necesidad de conocer este tipo de datos a fin de optimizar el rendimiento de las redes. Por otro lado, la necesidad de encontrar el punto de encuentro para la reutilizacin de estos datos a la hora realizar una adaptacin de la entrega de contenidos, que es nuestro principal objetivo. CAIDA, es sin duda un referente muy fuerte en el campo de la identificacin del estado de la red, que no debemos dejar de tener en cuenta en nuestro trabajo.
Estas condiciones en redes de alto rendimiento (por ejemplo, ATM, en las que la disponibilidad del ancho de banda y los mecanismos de control pueden garantizar el QoS) no constituyen un problema. Sin embargo, estas mismas condiciones constituyen un problema en redes con capacidad limitada o servicios del tipo best-effort. Ms an, considerando la amplia difusin del protocolo IP (Internet Protocol), basado sobre el servicio best-effort, encontramos que por lo general las aplicaciones multimedia dependen de un protocolo con casi ninguna garanta de QoS. Este trabajo se centra en la problemtica referida a la implementacin de una funcin de control de admisin a travs de la estimacin del ancho de banda disponible entre dos puntos de una red best-effort [DAV96]. Para ello, se utiliza la generacin de un flujo sncrono de paquetes de testeo (test packets) entre dos servidores de un canal genrico con ancho de banda determinada y midiendo la variacin del retardo (delay jitter) introducido por la red. Esta medida posteriormente es relacionada con la carga de la red. El tren de paquetes no est relacionado con un tipo particular de fuente de datos, slo se trata de un flujo sncrono con propsitos generales de testeo. En este marco de trabajo, si el canal est levemente cargado, es razonable esperar que el receptor vea un tren sincronizado de paquetes. Mientras que, con el aumento de la carga del canal, se observar una degradacin de tal sincrona. La carga del canal aumenta agregando, en dos momentos diferentes, una transferencia de ficheros a travs de FTP. As, a travs de una serie de consideraciones estadsticas, ver [MARY00], se encuentra una funcin representativa del estado de carga en la red, Figura 1720
Figura 17 Representacin del estado de la red bajo condiciones controladas del flujo de trnsito.
Algo a resaltar en este trabajo es la consideracin de la perspectiva del usuario sobre la Calidad de Servicio Percibido (PQoS Perceived Quality of Service). El PQoS representa el grado de calidad percibido por el termino medio de los usuarios. Mientras que el QoS est definido por restricciones analticas sobre cantidades objetivas tales como el delay o el jitter, el PQoS est dado por un conjunto de grados subjetivos definidos, por ejemplo, por etiquetas tales como muy bueno, bueno o suficiente. Para la estimacin del PQoS realizaron a un conjunto de estudiantes una serie de apreciaciones, para una aplicacin bajo diferentes condiciones de red que luego compararon con los resultados representados por
20
Pagina 44
la funcin de la figura anterior, encontrando esta funcin como una buena representacin de estas apreciaciones subjetivas. Finalmente, una de las posibilidades de uso de este esquema es utilizar la informacin del ancho de banda disponible para controlar la razn de transmisin de las fuentes de tiempo real (por ejemplo, video), diminuyendo esta proporcin cuando el umbral sea excedido. Otra aplicacin, es en el control de admisin. En este caso debera tenerse en cuenta que existe una cantidad de trfico de background incontrolable, que podra producir cambios significativos despus de que las decisin de admitir / rechazar sea tomada. Un marco de trabajo similar es planteado por Van Jacobson [JAC97] con el programa PATHCHAR. Sin embargo, los mecanismos de [JAC97] difieren de [MARY00] en dos aspectos fundamentales. [JAC97] est desarrollado sobre ICMP (Internet Control Message Protocol) y no sobre IP y trabaja sobre las bases de conexiones hop-by-hop y no sobre conexiones end-to-end como lo plantea [MARY00]. PATHCHAR surge como respuesta a los severos problemas de congestin existentes en Internet, permitiendo a cualquier usuario conocer el ancho de banda, delay, ndice de cola y prdidas de cada salto entre cualquier fuente / destino sobre la red. En [DOW99] podemos encontrar una interesante evaluacin del comportamiento de PATHCHAR sobre el anlisis de dos path (rutas) cuyas caractersticas de enlace son conocidas.
Pagina 45
tcnica para solucionar estos problemas. Esta tcnica, a diferencia de otras (carga distribuida de servidores, redireccionamiento, etc.) que proponen soluciones basadas en el balanceo de la carga entre mltiples servidores, permite que los servidores se preocupen por si mismos del problema del manejo de la sobrecarga. Las tcnicas tenidas en cuenta para realizar tal adaptacin son: Degradacin de la imagen por compresin (Image degradation by lossy compresin). Las imgenes GIF y JPG constituyen un amplio porcentaje del total de bytes de un sitio. En la mayora de los casos, estas imgenes pueden ser significativamente comprimidas, sin que ello signifique una disminucin apreciable en calidad sobre la mayora de los monitores de los clientes, lo cual demuestra un potencial para conservar recursos mediante la degradacin de la calidad de la imagen. Reduccin de los objetos incrustados en las pginas (Reduction of embedded objects per page). Desde la perspectiva del servidor, el tamao del documento no es tan importante como el nmero de objetos incrustados en la pgina. Durante la recuperacin de una URL la aplicacin del cliente enva peticiones independientes para traer sus objetos incrustados [FIE97]. Reduccin de los enlaces locales (Reduction in local links). Otra forma de adaptacin de contenido es reducir los enlaces locales. Esta reduccin afectar el comportamiento de navegacin del usuario de manera tal que tiende a disminuir la carga sobre el servidor.
As, bajo este marco de trabajo, Abdelzaher y Bhatti [ABD99-1] introducen una arquitectura para la provisin de calidad de servicio (QoS) en servidores web a fin de realizar la diferenciacin entre clases de clientes. Esta arquitectura, planteada como una propuesta para la realizacin de control de admisin, se realiza justamente a travs de las tcnicas de adaptacin de contenidos antes mencionada. La capacidad de los actuales servidores de hospedar mltiples sitios los conduce ante un doble problema. Por un lado, el potencial conflicto de intereses y recursos sobre el servidor denominado performance isolation (aislamiento del rendimiento) y por otro lado a la necesidad de dar un tratamiento preferencial a los clientes ms importantes denominado service differentiation (diferenciacin de servicios). [ABD99-1] propone una adaptacin de contenidos como una nueva metodologa para controlar los recursos del servidor, impedir la sobrecarga y ejecutar el mencionado ailamiento del rendimiento y la diferenciacin de servicios. Trabajos como [IYE97] o [LI00] son otras propuestas de control de admisin sobre servidores que al igual que [ABD99-1] apuntan a mejorar el rendimiento del servidor En [ABD99-1] se asume que los contenidos estn pre-procesados y almacenados en mltiples copias que difieren en calidad y magnitud. Para la implementacin, interponen una capa de software entre los procesos del servidor y el subsistema de comunicacin, de manera tal que, esta capa tiene acceso a las peticiones http recibidas por el servidor y a las respuestas enviadas por ste a los clientes. Esta capa de software intercepta cada peticin y la redirige a la copia adecuada de contenidos. Para esto, la capa de adaptacin de contenidos debe medir el grado actual de utilizacin del servidor y decidir el alcance de la adaptacin que impedir la sobrecarga del servidor. Un importante punto a destacar en este proceso, es que adems el sistema tiene la capacidad de compartir la capacidad no utilizada. Es decir, ante la co-existencia de mltiples sitios, mientras que cada uno adapta sus contenidos bajo condiciones de carga a fin de permanecer dentro de sus asignaciones de capacidad, el exceso de capacidad que no es utilizado, puede ser puesto disponible para el resto de los sitios existentes.
Pagina 47
Esta arquitectura, para una administracin del QoS sustentada a travs de una adaptacin de contenidos, se diferencia de los actuales servidores no adaptativos o de aquellos que implementan un control de adaptacin binaria, en la capacidad de permitir a los servidores proveer una suave degradacin de los contenidos acorde a la carga que stos presentan. Ahora bien, una ltima observacin, realizada oportunamente por [ABD99-1], es que la metodologa de un almacenamiento mltiple de copias del sitio web es posible para sitios web estndares, pues en el caso de servidores de video, por ejemplo, sto tendra costos muy elevados posiblemente por la capacidad de disco necesitada.
un determinado objeto o determinar que no est cacheado, disminuyendo el uso de la red. En [KAR99] puede consultarse la manera en que este sistema fue implementado y una comparacin con otras posibilidades.
3.5.3 Prefetching
prefetching es la tcnica basada en la bsqueda anticipada de objetos probables a ser solicitados. en [DAVI99] se muestra uno de los trabajos realizados a travs de esta tcnica, con el objetivo de reducir el uso de la red y de la carga del servidor y mejorar de esta forma el tiempo de respuesta experimentado por los usuarios. Tiene como foco principal de atencin aplicar mecanismos de aprendizaje al problema de prediccin de navegacin en la web. En concreto, predecir la prxima pgina a ser visitada por el usuario. Con la premisa de tener fabricado un modelo de usuario, el sistema usando este modelo, puede anticipar la pgina a recuperar e ir a buscarla antes de que sea pedida y tenerla en cache. De manera que el usuario experimenta bajos retardos cuando intente recuperarla. El sistema planteado por [DAVI99] incluye una variedad de fuentes de informacin para la prediccin. Estas fuentes pueden incluir: Un historial individual del cliente. Sirve de gua del comportamiento del usuario. Patrones comunitarios de uso. Con la finalidad que dichos patrones promedios de comportamiento, puedan servir como puntos de apoyo cuando se carece de informacin individual. Utilizacin del contexto cuando los historiales no son relevantes. Para esto, analizan los contenidos textuales de las pginas recientemente recuperadas y los enlaces a las pginas a las que conducen a fin de que sirvan de guas de referencia para detectar los intereses del usuario. Los contenidos de otras aplicaciones relacionadas (news, email) que tambin presentan URLs que pueden ser seleccionadas como pginas a recuperar.
Es a travs de la combinacin de estas diferentes fuentes de informacin, que [DAVI99] realiza las predicciones de las acciones y consegue reflejar el inters del usuario.
Pagina 49
Aunque los resultados de estas simulaciones fueron realizados bajo condiciones controladas del entorno, muestran la efectividad tanto del caching como del prefetching, enfatizando, de esta manera la necesidad, de mejorar estas tcnica.
tcnicas de caching o prefetching poseen un punto interesante a tener en cuenta, ya que estn basadas en algoritmos de aprendizaje, para la modelacin del comportamiento, algoritmos que, a priori, no inciden de manera importante en dichos procesamientos. Queda para futuros trabajos, realizar el balance de ventajas y desventajas de cada una de estas tcnicas para poder realizar una decisin acertada en la implementacin de nuestro sistema.
Pagina 51
A travs de la Tabla 1 se observa por un lado, que en ninguno de los sistemas descritos estn considerando todas estas caractersticas a la hora de realizar la adaptacin de contenidos. Los grupos de Hewlett Packar y Microsoft China, podramos resaltarlos como los ms completos en cuanto a sus consideraciones, sin embargo, vemos que no trabajan directamente sobre aspectos referentes a la carga del servidor. Por otra parte la denominacin utilizada para referirse al objetivo perseguido, vara segn el entorno de aplicacin, como ya lo habamos planteado en el apartado de Adaptatividad Adaptabilidad. En la tabla, bajo la columna Denominacin, hemos querido simplificar este concepto a travs de dichas denominaciones. Lo que se puede constatar, es que sea cual sea la terminologa empleada, la tarea apunta a una Adaptacin de Contenidos teniendo en cuenta alguna de las caractersticas planteadas con el objetivo de optimizar el rendimiento de los servicios sobre Internet. Ahora bien, bajo esta consigna nos planteamos preguntas tales como: es posible extender los conceptos tericos realizados por De Bra y Brusilovsky en el campo del modelado del usuario a los otros entornos? podemos utilizar los conceptos de Sistemas Hipermedia Adaptables, Adaptativos y Dinmicos en entornos que tienen en cuenta caractersticas tales como tipo de dispositivo o estado de carga del servidor? podemos implementar un sistema nico que considere todas las caractersticas planteadas y aunar la terminologa existente en los diversos campos? Como respuesta a todo esto, surge la propuesta de SHAAD Sistema Hipermedia Adaptable, Adaptativo y Dinmico, [MER02] [MER02-1], un sistema que atendiendo el estado de todas las caractersticas mencionadas y la variedad de contenidos web multimedia existentes, intenta adecuar dinmica o estticamente la informacin disponible y entregarla de la manera ms eficiente posible, con el fin de mejorar el rendimiento de la red.
Pagina 52
Grupo de Investigacin Hewlett Packard Laboratories Microsoft Research China De Bra Brusilovsky MAS-PLANG Sitios Web Adaptativos Information Filtering Algoritmos de Aprendizaje Proyecto UMA Proyecto MONADS InfoPyramid Digestor CAIDA Redes Best-Effort Web Content Adaptation Caching y Prefetching Web Servers
CPU X X X X X X X
TDA X X
TA /ER X X
ECS
X X X X X X X X X
Tabla 1 rea de investigacin de los grupos descritos.
Disponibilidad de Contenidos
SHAAD incluye los conceptos de Adaptabilidad, Adaptatividad y Dinamismo y lo hace de una manera muy particular. Considera al sistema como una anidacin de sub-sistemas, es decir, su comportamiento ser adaptable, adaptativo o dinmico dependiendo de la manera que en un momento dado se encuentre realizando las tareas de definicin de las caractersticas de entrada. En la figura 18, se presenta una estructura bsica de los componentes que actan en el sistema.
Caractersticas del Usuario? Tipo de Dispositivo? Tipo de Acceso, Estado de la Red? Estado de Carga del Contenido Adaptado
SHAAD
Pagina 53
Recordemos, brevemente, los conceptos de [BRA99], expuestos en el Captulo 2: Hipermedias adaptables: sistemas en los que el usuario puede proveer algn perfil. Hipermedias adaptativos: sistemas que monitorizan el comportamiento de los usuarios y adaptan la presentacin teniendo en cuenta dicho comportamiento. Hipermedias dinmicos: El comportamiento de los usuarios tambin es monitorizado pero la adaptacin en lugar de ser cambiada seleccionando presentaciones predefinidas es reconstruida dinmicamente a partir de los objetos individuales que componen la pgina web.
Estos conceptos, como se expuso, hacen referencia al usuario y su comportamiento. Ahora bien, podemos extender esta visin y generalizar el concepto de usuario/comportamiento hacia otras caractersticas (dispositivo, estado de la red, etc.)?. En principio, esto es lo que se ha hecho en SHAAD, es decir, extender estas conceptualizaciones y pensar que un cambio de alguna de las caractersticas del usuario, tipo de dispositivo, estado de la red o carga del servidor pueden ser representados a travs de un cambio de su comportamiento. Por otra parte, al tratar de clasificar las metodologas o mecanismos para la definicin de cualquiera de estas caractersticas, podramos pensar en mtodos directos o indirectos, estticos o dinmicos y en la combinacin de ellos, caer dentro de un sistema que pueda tratarse como adaptable, adaptativo o dinmico. En la Tabla 2, representa de forma general, las distintas metodologas de definicin de las caractersticas y la solucin planteada para poder mejorar el rendimiento del sistema y su entrega de contenidos. Tratar de clasificar que tcnicas y/o soluciones son directas o indirectas, estticas o dinmicas?, puede llegar a ser motivo de un larga discusin, que cae fuera de los alcances de este trabajo de investigacin, pero que debern ser estudiados en algn momento. Pero si queda claro que, existen entre ellas diferencias marcadas en la forma y modo de implementarlas y que despus de analizarlas se podra llegar a algn acuerdo respecto a lo mencionado. Por todo esto podemos afirmar que nuestra clasificacin de adaptable, adaptativo y dinmico es vlida y aplicable.
Pagina 54
Grupo de Investigacin Hewlett Packard Laboratories Microsoft Research China De Bra Brusilovsky MAS-PLANG Sitios Web Adaptativos Information Filtering Algoritmos de Aprendizaje Proyecto UMA Proyecto MONADS InfoPyramid Digestor CAIDA Redes Best-Effort Web Content Adaptation Caching Prefetching
Herramienta de definicin http, TCP/IP, cookies, Logs, Interfaz para el usuario, cuestionarios directos Aplicaciones para testeo
Solucin adoptada
Tcnicas para la transformacin de contenidos (Information Abstraction, Modality Transform, etc.) Analizador y reconstructor de contenidos (Parser) Cuestionarios para el usuario y Adaptacin de Contenidos y monitoreo del comportamiento Adaptacin de enlaces Cuestionarios para el usuario Adaptacin de Contenidos y Adaptacin de enlaces Anlisis de los logs del servidor Generacin de nuevos ndices para los enlaces Cuestionarios para el usuario Tcnicas de Razonamiento Basado en Casos para filtrar la informacin Valoracin de documentos y Filtrado inteligente de la tcnicas de IA para inferencias informacin automticas posteriores N/E (No Especificado) Banco Conversin de los objetos de prueba para experimentos multimedia (Testbed) Agentes Inteligentes Transformacin y transcodificacin de contenidos N/E Copia de contenidos (off-line), transformacin de contenidos (online) N/E Tcnicas de re-authoring Mediciones pasivas y activas N/E
Estimaciones sobre entornos N/E controlados Mediciones sobre el servidor Transformacin y transcodificacin de datos Anlisis de los logs del servidor Cache servers Modelado del usuario individual Prediccin y bsqueda anticipada y global de las pginas
Tabla 2 Herramientas para definicin y soluciones adoptados por los diferentes grupos reseados.
El modelo del SHAAD, Figura 19, est formado por 4 mdulos bsicos: Mecanismos para la definicin de las caractersticas para la adaptacin. Tienen como finalidad realizar la definicin de las caractersticas ya mencionadas: caractersticas y/o preferencias del usuario, tipo de dispositivo de acceso del cliente, tipo de acceso a la red, estado de la red y estado de carga del servidor. Mdulo de contenidos. Tiene como funcin entregar los contenidos peticionados, ya sea a travs de una generacin dinmica a partir de los elementos atmicos que constituyen la pgina web (generacin on-line) o la seleccin entre diferentes versiones estticas de esos contenidos previamente generados, (generacin off-line). Motor de decisin. Es el ncleo del sistema y el lugar en el que se evalan el estado de las caractersticas para la adaptacin, los contenidos disponibles. A partir de stos se infiere cuales son los mecanismos de adaptacin a aplicar para entregar el material de forma ptima al usuario. Este motor debe ser lo suficientemente inteligente para llegar a una solucin de compromiso adecuada, dado que est considerando todas las caractersticas para la adaptacin.
Pagina 55
Mecanismos de adaptacin. Teniendo disponible el nuevo sitio web generado por el mdulo de contenidos, puede implementar mecanismos alternativos de adaptacin. Por ejemplo, en el caso que debido al estado de carga del servidor no pudiera generarse dinmicamente una nueva pgina de contenidos. Esto implica que a pesar de no poder realizar la mencionada regeneracin, es an posible aplicar mecanismos alternativos a una pgina esttica (por ejemplo link adaptation)
MOTOR DE DECISIN
Mecanismos de adaptacin
Mdulo de Contenidos
VERSIONES ESTTICAS OFF-LINE
En el grfico anterior, se observa claramente la estructura anidada de los subsistemas hipermedias adaptable, adaptativo y dinmico de SHAAD y los mdulos de Mecanismos para la definicin de las Caractersticas para la Adaptacin y de Mecanismos de Adaptacin estn dentro de cualquiera de estos subsistemas. Esto tiene como finalidad indicar que la forma y modo de implementar estos mecanismos, darn al sistema las caracterizaciones de adaptabilidad, adaptatividad o dinamismo de tales subsistemas. En el modelo bsico de SHAAD, el Mdulo de Contenidos ha sido separado del Motor de Decisin. Su funcionamiento es una caracterstica interesante a tener en cuenta, ya que, en este mdulo hemos incluido un Analizador de Contenidos, cuyo funcionamiento se explicar ms adelante, que regenera dinmicamente la pgina a tratar, siempre y cuando la carga del servidor se lo permita. A nuestro entender es posible separarlo del Motor de Decisin, dado que ser este ltimo el que decida si dicho analizador puede dispararse o no, siempre que la carga del servidor se lo permita. Caso contrario, una copia off-line del contenido, previamente almacenado, ser seleccionado para la entrega. Tambin es interesante de verificar en el modelo, la existencia del Mdulo de Adaptacin, separado en este caso del Mdulo de Contenidos, ntimamente ligados pero separados. Con esto, se pretende representar que las tcnicas de adaptacin implementadas podrn ejecutarse, ya sea, dinmicamente sobre el analizador de contenidos, o sobre los contenidos estticos, mantenidos off-line, seleccionados desde las copias mantenidas del sitio web. De esta forma, queremos significar que an despus de seleccionar una copia disponible en el servidor con una determinada calidad, podremos aplicar alguna tcnica de adaptacin a fin de mejorar ms la entrega de los contenidos al usuario final (por ejemplo adaptacin de enlaces) y consecuentemente optimizar el rendimiento del servicio.
Pagina 56
MOTOR DE DECISIN
Mdulo de Contenidos
VERSIONES ESTTICAS OFF-LINE GENERACIN DINMICA A PARTIR DE ELEMENTOS ATMICOS ON-LINE
...
Contenido Hipermedia
Analizador de Contenidos ?
Mecanismos de adaptacin
Pagina 57
Mecanismos para la definicin del estado de carga del servidor. Con las herramientas evaluadas: herramientas propias del servidor web (logs) y mediciones on-line sobre el servidor a travs del desarrollo de aplicaciones para tal fin. Mdulo de Contenidos. Se encarga de generar dinmicamente o de seleccionar a travs de versiones estticas el contenido adecuado. Tiene los siguientes bloques: 1. Generacin dinmica a partir de elementos atmicos. Genera dinmicamente la nueva pgina a partir de los elementos que componen la pgina original a travs del Analizador de Contenidos, esquematizado en la figura. 2. Versiones estticas hipermedia. En este bloque se encuentran disponibles versiones de las pginas web en diferentes calidades de formato y contenido.
Mecanismos de adaptacin
MOTOR DE DECISIN
CONTENT ADAPTATION
LINK ADAPTATION
Mdulo de Contenidos
Figura 21 Submodelo para SHAAD considerando las caractersticas o preferencias del usuario
Pagina 58
Mecanismos de Adaptacin. De igual manera, en este mdulo hemos tomado como ejemplos las tcnicas para la adaptacin de contenidos mencionadas en el Captulo 2. Los mecanismos ejemplificados son: Adaptacin de Enlaces y Adaptacin de Contenidos.
4.1.3 Submodelo Acceso a la red: Dispositivo del cliente, Tipo de Acceso y Estado de la Red
Aunque estos tres conceptos son diferentes los consideramos juntos pues estn ntimamente relacionadas en lo que a tecnologa se refiere. De estas variables depender, en ltima instancia, la calidad del formato del contenido que se entrega al usuario. Como lo hemos manifestado, la gama de tipos de dispositivos de acceso a la red existentes es muy amplia y tienen una estrecha relacin con el tipo de conexin que disponen La figura 22, describe el submodelo de SHAAD, que representa el comportamiento del sistema teniendo en cuenta esta caracterstica, Es necesario describir particularmente dos mdulos del mismo: Mecanismos para la definicin de las caractersticas del dispositivo de acceso del cliente y el tipo de acceso / estado de la red. En este mdulo, al igual que antes, se han ejemplificado algunas de la tcnicas vistas con la misma finalidad. As, hemos incluido el protocolo http, las sugerencias de usuario, herramientas especficas para la determinacin del estado de la red,etc. Mecanismos de Adaptacin. Los ejemplos expuestos en el grfico: Algoritmos de Compresin, Algoritmos de Transformacin o Algoritmos de Clasificacin de datos, juegan en este submodelo un interesante rol a la hora de justificar el dinamismo del sistema. A modo de representar el comportamiento del sistema a travs de SHAAD, lo hemos situado en el mdulo de Mecanismo de Adaptacin, pero obsrvese que existe una estrecha vinculacin con el mdulo de contenidos, entendiendo que all podran tambin ejecutarse estas tcnicas de transformacin de datos.
Mecanismos de adaptacin
Algoritmos de Compresin de Datos
MOTOR DE DECISIN
Mdulo de Contenidos
Pagina 59
MOTOR DE DECISIN
Mecanismos de adaptacin
Mdulo de Contenidos
VERSIONES ESTTICAS OFF-LINE
Pagina 60
4.2 Implementaciones
A continuacin haremos una resea del Analizador de Contenidos que se est desarrollando en este momento y el anlisis realizado sobre el protocolo HTTP y sus posibilidades de brindarnos informacin.
Documento HTML
JTidy
Documento XHTML
S HTM/ HTML?
Programa JSP
Usuario
No Entrega documento original
Pagina 61
El XML permite especificar la estructura de un contenido, permitiendo de esta manera realizar un elevado nmero de operaciones de una manera eficaz. Analizando posteriormente que el XHTML es un documento HTML pero que sigue las reglas de buena formacin especificadas por XML y a la vez utilizan las herramientas que stos ltimos proporcionan, se decidi transformar directamente los documentos HTML en XHTML.
En lo referente al estado de la red: grado de ocupacin del ancho de banda - libre, semi-ocupado, ocupado.
Para poder realizar el tratamiento de los elementos multimedia se dispone de diferentes versiones de un mismo elemento multimedia. Estas versiones son estticas, es decir, se tiene diferentes formatos del mismo elemento multimedia. Estas diferentes versiones estticas se encuentran dentro del mismo servidor, de manera tal que, cuando se aplica un perfil que implica un cambio de los elementos multimedia contenidos en un documento, se determina cual es el directorio de donde se obtendrn los elementos a enviar. Se han definido los siguientes perfiles, Tabla 3: Perfil 0: en este perfil solamente se tiene en cuenta el estado de la red. En el caso que el estado de sta sea muy malo, congestionado, se activar este perfil. Es independiente del valor de las caractersticas que definen al dispositivo de acceso del cliente. Documento a entregar: en este perfil se entrega un documento que contiene solamente texto, es decir, sin elementos multimedia (imgenes, video, sonido). En los lugares, donde deberan aparecer estos elementos multimedia, indica que all haba un objeto media. Perfil 1: este perfil se activa cuando las condiciones de la red y el clientes son muy buenas. En este caso el cliente dispone de todo el software necesario, de un
Pagina 62
dispositivo con monitor de alta resolucin con colores de alta densidad y al mismo tiempo el estado de la red sin congestin. Documento a entregar: con las condiciones dadas el documento solicitado se enva con todos los elementos (imagen, video, sonido) incorporados, tal y como estn en el documento original. Perfil 2: este perfil se activa cuando alguna o ambas variables (estado de la red y caractersticas del dispositivo del cliente) se encuentra en un estado que podemos calificar de medio. Como un estado medio hacemos referencia a tener un ancho de bando semi-ocupado, o que las caractersticas del dispositivo del cliente tiene una pantalla de 800x600, actuando independientemente de si tiene o no software de video. Documento a entregar: el documento se envia pero modificando los elementos multimedia. En este caso, la modificacin que se realiza, ser la de cambiar las imgenes por unas imgenes de menor calidad (calidad de color, medida de la imagen, etc.); no se envia el video, sino que ste ser substituido por un conjunto de 10 imgenes. Perfil 3: este perfil se activa cuando la calidad del dispositivo del cliente es baja y el estado de la red no es malo. La calidad del dispositivo del cliente se considera que es baja cuando el cliente dispone de un dispositivo con monitor de baja resolucin. Documento a entregar: el documento se envia pero modificando los elementos multimedia. En este caso, la modificacin que se realiza, ser la de cambiar las imgenes por unas imgenes de menor calidad (calidad de color, medidas de la imagen, etc.), menos que en el Perfil 2; no se envia el video sino que ste ser sustituido por un conjunto de 5 imgenes.
RED (Ancho de Banda) Ocupado Perfil 0 Alta DISPOSITIVO (Resolucin 4.2.1.3.1.1.1.1.1 Mediana Perfil 0 de Pantalla) Perfil 0 Pequea Semiocupado Perfil 2 Perfil 2 Perfil 3 Libre Perfil 1 Perfil 2 Perfil 3
Pagina 63
Otro parmetro que se ha tenido en cuenta para la adaptacin es el Color. Este trabaja conjuntamente con los perfiles definidos. Los perfiles determinan que cdigo de condicin se ha de ejecutar de la plantilla XSLT correspondiente. En cambio, con el parmetro Color se indica si las imgenes y/o video que se han de enviar, sern en colores o no. Lo mismo pasa con los parmetros que indican si el usuario dispone de software de video o audio. En el caso se disponga de software para alguno de ellos, directamente no se envian los ficheros correspondientes a audio o video. La tabla 4, resume el comportamiento del sistema teniendo en cuenta el Color y la disponibilidad del software correspondiente a Video o Sonido.
Valores posibles Colores Color Escala de grises S Software de video No S Software de sonido No
Tratamiento Elementos multimedia en color original Imagen y video en escala de grises Se enva el fichero de video No se enva el fichero de video Se enva el fichero de audio No se enva el fichero de audio
En la Tabla 5, se muestra un esquema nos que describe las adaptaciones posibles que se realizan, sobre cada uno de los respectivos elementos multimedia, segn el perfil a aplicar.
Perfil 0 Imgenes
Perfil 3 Imgenes reducidas a una cuarta parte del original y con el tratamiento de color correspondiente Secuencia de 5 imgenes sobre las que se realiza el tratamiento de imgenes definido en el perfil 3
Si tiene el software necesario, se enva el original con el tratamiento de color correspondiente. Caso contrario, se realiza el mismo tratamiento que el Perfil 2 Si tiene el software necesario se enva el original
Secuencia de 10 imgenes sobre las cuales se realizar el tratamiento de imgenes del Perfil 2
Video
Sonido
Pagina 64
cabeceras definidas, llegarn a tener un inters particular para nuestros estudios, por lo que habr que definir cuales son las que pueden aportar algo. A priori, podemos decir que etiquetas tales como : Content-Type, Content-Length, Content-Encoding, Accept, Authorization, From, Referer, User-agent, pueden resultar de inters. Ahora bien, de encontrar cual es el conjunto de etiquetas que puedan ser de utilidad y sabiendo que en toda peticin del cliente, no siempre se incluyen la totalidad de etiquetas existentes, cabe entonces la pregunta cmo hacemos para indicarle al cliente, directa o indirectamente, que enve dichas etiquetas?. De momento, sabemos que dependiendo del tipo de navegador, cada uno tiene configurado particularmente un estndar de etiquetas a enviar. En principio, es posible configurar en los distintos navegadores las etiquetas a enviar. As por ejemplo, el Internet Explorer, posee un mdulo adicional, el Internet Explorer Kit, que en principio nos permitira configurar algunas de las etiquetas; o en el Mozilla, un navegador de cdigo abierto, podramos recuperar la porcin de cdigo que configura el conjunto de etiquetas a enviar, modificarlo y recompilar nuestra propia versin, a fin de distribuirla. Situacin, probablemente vlida para el Netscape tambin. Las posibilidades de reutilizacin de las caractersticas del protocolo HTTP, son perfectamente vlidas. Queda para futuros anlisis y experimentos, la decisin final de considerar su implementacin.
4.3 Conclusiones
Hemos presentado as el SHAAD - Sistema Hipermedia Adaptable, Adaptativo y Dinmico para la adaptacin de contenidos. Este sistema intenta cubrir desde diferentes puntos de vista la amplia gama de trabajos relacionados con la adaptacin de contenidos hipermedia. As, a travs del anlisis de diversas tcnicas para la definicin de las caractersticas para la adaptacin (caractersticas del usuario, caractersticas del dispositivo de acceso del cliente, tipo de acceso, estado de la red y carga de la red) hemos tratado de englobar los distintos puntos de vista y definir a travs de un modelo nico nuestro punto de partida para la adecuacin de contenidos Un Analizador de Contenidos implementado en XML se encuentran en una etapa de implementacin, a travs del cual se realiza una seleccin inteligente de los objetos que conforman una pgina para luego regenerarla atendiendo algunas caractersticas de adaptacin. Nuestro modelo, estrictamente modular, nos permitir trabajar sobre el amplio espectro de aspectos y plantear de esta forma soluciones parciales a un problema que globalmente puede resultar excesivamente complejo debido al espectro de caractersticas que hay que analizar. En trabajos futuros se realizar el anlisis, discusin y seleccin de los mecanismos, herramientas y/o mtodos para la definicin de caractersticas para la adaptacin. Para finalmente implementar en SHAAD la adaptacin de contenidos en base a estas caractersticas.
Pagina 66
5 - Plan de Trabajo
Despus de haber realizado un anlisis preliminar de las diferentes caractersticas que se deberan tener en cuenta para definir la arquitectura del SHAAD, ser necesario profundizar en el anlisis de la tecnologa a implementar sobre el Motor de Decisin. Adems, hay diversos aspectos que se deben continuar estudiando a fin de llegar a obtener las herramientas adecuadas para el desarrollo del sistema. A continuacin se muestra el cronograma de actividades necesario para la obtencin del sistema propuesto en el plazo de dos aos.
ACTIVIDADES
4/02 1/03 2/03 3/03 4/03 3/04 2/04 3/04
Estudio y seleccin de los mecanismos para la definicin de las caractersticas y/o preferencias del usuario Estudio y seleccin de los mecanismos de definicin del tipo de dispositivo de acceso Estudio y seleccin de los mecanismos de definicin del estado de la red Estudio y seleccin de los mecanismos de definicin del estado de carga del servidor Desarrollo del mdulo de contenidos Desarrollo y puesta a punto del analizador de contenidos Estudio de la factibilidad y necesidad de la implementacin de tcnicas de transformacin, transcodificacin y compresin de datos Estudio de las ventajas y desventajas de implementar los mecanismos de adaptacin sobre el servidor o sobre un proxy Anlisis de la tecnologa a implementar sobre el Motor de Decisin Implementacin del SHADD Redaccin de papers para la presentacin en congresos y revistas. Redaccin del documento de Tesis Doctoral
Pagina 67
6 - Referencias
[ABD99] Tarek F. Abdelzaher, Nina Bhatti, Web Content Adaptation to Improve Server Overload Behavior, The 8th International World Wide Web Conference, Toronto, Ontario, Canada, 1999. [ABD99-1] Tarek F. Abdelzaher, Nina Bhatti, Web server qos management by adaptive content delivery, Int. Workshop on Quality of Service, June 1999. [APER01] Andrew Perkis, Yousri Abdeljaoued, Charilaos Christopoulos, Touradj Ebrahimi and Joe Chicharo, Universal Multimedia Access from Wired and Wireless systems, Birkhauser Boston transactions on Circuits, Systems and Signal Processing; Special issue on Multimedia Communications, Vol. 20. , No. 3, 2001, pp. 387-402 [APER01-1] UMA Project - Andrew Perkis, NTNU-Department of Telecommunications, Leif Arne Rnningen, NTNU-Department of Telematics http://129.241.2.13/UMA/IKT2010-UMA.html [BAK99] Scott M. Baker and Bongki Moon. Distributed cooperativeweb servers. Computer Networks, 31(11-16):1215-1229, 1999. [BER96] T. Berners-Lee, R. Fielding, and H. Frystyk, Hypertext Transfer Protocol{HTTP/1.0, RFC 1945 - Internet Engineering Task Force, May 1996. [BIC99] T. Bickmore and B. Schilit, "Digestor: Device Independent Access to the World Wide Web", proceedings of the Sixth International World Wide Web Conference, Santa Clara, California, 1999 . [BIL99] Daniel Billsus, Improving User Model Acquisition from Labeled Text Documents, Proceedings of the 2nd Workshop on Adaptive Systems and User Modelling on the WWW. [BRA92] P. De Bra, G. J. Houben, Y. Kornatzky. An Extensible Data Model for Hyperdocuments. Proc. 4th ACM Conference on Hypertext, Milan, pp. 222231, 1992. [BRA98] P. De Bra and L. Calvi. Towards a Generic Adaptive Hypermedia System. Proc. Second Workshop on Adaptive Hypertext and Hypermedia, Pittsburgh, pp. 511, 1998. [BRA99] Paul De Bra, Design Issues in Adaptive Web-Site Development, Proceedings of the 2nd Workshop on Adaptive Systems and User Modelling on the WWW [BRA99-1] De Bra, P., Houben, G.J., Wu, H., AHAM: A Dexter-based Reference Model for Adaptive Hypermedia. Proceedings of ACM Hypertext99, Darmstadt, pp. 147-156, 1999. [BRU96] P. Brusilovsky. Methods and Techniques of Adaptive Hypermedia. User Modeling and User-Adapted Interaction, Vol. 6, pp. 87129, Kluwer academic publishers, 1996. [BRU01] Peter Brusilovsky, Adaptive Hipermedia, User Modelling and User-Adapted Interaction 11: 87-110, 2001, Kluwer Academic Publishers, Netherlands [CAI02] CAIDA - Cooperative Association for Internet Data Anlysis - University of Californias San Diego Supercomputer Center. http://www.caida.org [CAM00] Stefano Campadello, Heikki Helin, Oskari Koskimies, Pauli Misikangas, Mikko
Pagina 68
Mkel, Kimmo Raatikainen, Using Mobile and Intelligent Agents to Support Nomadic Users, 6th International Conference on Intelligence in Networks (ICIN2000), 2000, Bordeaux, France. [CAM99] S.Campadello, K.Raatikainen - Department of Computer Science, University of Helsinki, Finland Agents in Personal Mobility. Proceedings of the First International Workshop on Mobile Agents for Telecommunication Application MATA99. Otawa Canada October 6-8-1999. World Scientific pp 359-374. [CHE00] Chen, J.L., Yang, Y.D., and Zhang, H.J. An Adaptive Web Content Delivery System. Proc. AH2000 (Tronto, Italy, 2000) Springer Press, 284-288. [CLA99] K. Claffy and S. McCreary. Internet measurement and data analysis: passive and active measurement, http://www.caida.org/Papers/Nae/4hansen.html, 1998. [CLA99-1] K. Claffy. Internet measurement and data analysis: topology, workload, performance and routing statistics, NAE99 workshop paper, 1999. [DAV96] F. Davoli, O. Khan, and P. Maryni, Estimating the Available Bandwidth for Real-time Traffic over Best Effort Networks, in Protocols for High-Speed Networks V, W. Dabbous and C. Diot, Eds., 1996, pp. 312, IFIP, Chapman & Hall. [DAVI99] B. D. Davison. Adaptive Web Prefetching. In Proceedings of the 2nd Workshop on Adaptive Systems and User Modeling on the WWW, pages 105--106, Toronto, May 1999 [DHW99] De Bra, P., Houben, G.J., Wu, H., AHAM: A Dexter-based Reference Model for Adaptive Hypermedia. Proceedings of ACM Hypertext99, Darmstadt, pp. 147-156, 1999. [DOW99] A.B. Downey, "Using Pathchar to Estimate Internet Link Characteristics,', in ACM SIGCOMM, Sept. 1999. [FAB00] R. Fabregat, J.L. Marzo, C.I. Pea, "Teaching Support Units", Computers and Education in the 21st Century: Kluwer Academic Publishers, 2000. [FIE97] R. T. Fielding and G. Kaiser, The apache http server project", IEEE Internet Computing, vol. 1, no. 4, pp. 88-90, July 1997 [FIE99] R. T. Fielding, J. Gettys, J. C. Mogul, H. Frystyk, L. Masinter, P. Leach, and T. Berners-Lee. Hypertext Transfer Protocol --- HTTP/1.1. RFC 2616, http://ftp.isi.edu/in-notes/rfc2616.txt, June 1999 [GAR93] F. Garzotto, P. Paolini, D. Schwabe. HDM A model-based approach to hypermedia application design. ACM Transactions on Information Systems, 11:1, pp. 123, 1993. [HAL90] F. Halasz and M. Schwartz. The Dexter Reference, Model. In Proc. NIST Hypertext StandardizationWorkshop, pp. 95133, 1990. [HAL94] F. Halasz and M. Schwartz. The Dexter Hypertext Reference Model. Communications of the ACM, Vol. 37, nr. 2, pp. 3039, 1994. [HEI97] John Heidemann, Katia Obraczka, and Joe Touch. Modeling the performance of HTTP over several transport protocols. IEEE/ACM Transactions on Networking, 5(5), October 1997. [HPR01] Habitat-ProTM Environment, Agents Inspired Technologies S.A, University of Girona, Girona, Spain, 2001, http://www.agentsinspired.com.
Pagina 69
[IYE97] A. Iyengar, E. MacNair, and T. Nguyen. An Analysis of Web Server Performance. In Proceedings of GLOBECOM97, volume 3, pp. 1943-1947, November 1997. [JAC97] Van Jacobson, Pathchar a tool to infer characteristics of Internet paths, Tech. Rep., Network Research Group, Lawrence Berkeley National Laboratory, Berkeley, CA, April 21 1997, available at: ftp://ftp.ee.lbl.gov/pathchar. [KAM97] Tomihisa Kamada, et. al., Client-specific Web Services by using User Agent Attributes, 12/97, http://www.w3.org/TR/NOTE-agent-attributes. [KAR97] David Karger, Eric Lehman, Tom Leighton, Matthew Levine, Daniel Lewin and Rina Panigrahy. Consistent hashing and random trees: Distributed cachine protocols for relieving hot spots on the World Wide Web. In Proceedings of the Twenty-Ninth Annual ACM Symposium on Theory of Computing, pages 654-663 , 1997. [KAR99] David Karger, Tom Leighton, Danny Lewin, and Alex Sherman. Web caching with consistent hashing. In Proc. of 8th International World--Wide Web Conference, Toronto, Canada, 1999. [KLE00] Nomadic Working Team (NWT). 1995. "Nomadicity in the NII," Cross-Industry Working Team, Corporation for National Research Initiatives, Reston, Va. [KOS00] O.Koskimies, K.Raatikainen Department of Computer Science, University of Helsinki, Finland Partitioning Aplications with Agents. Second International Workshop on Mobile Agents for Telecommunication Applications (MATA2000), pages 79-93. Lecture Notes in Computer Science, Springer Verlag, September 2000. [KRI99] Balachander Krishnamurthy, Jeffrey Mogul, and David Kristol. Key differences between HTTP/1.0 and HTTP/1.1. In Eighth International World Wide Web Conference, Toronto, Canada, May 1999. [KRO97] T. M. Kroeger, D. D. E. Long, and J. C. Mogul. Exploring the Bounds of Web Latency Reduction from Caching and Prefetching. In Proceedings of the USENIX Symposium on Internet Technologies and Systems (USITS '97), Dec. 1997. [LI00] K. Li and S. Jamin. A measurement-based admission controlled web server. In Proceedings of IEEE INFOCOM 2000, Tel Aviv, Israel, March 2000. [MA00] Wei-Ying Ma, Ilja Bedner, Grace Chang, Allan Kuchinsky, and HongJiang Zhang, A framework for adaptive content delivery in heterogeneous network environments, MMCN2000, San Jos, California, 2000. [MAR99] Mauro Marinilli, Alessandro Micarelli and Filippo Sciarrone, A Case-Based Approach to Adaptive Information Filtering for the WWW, 7th International Conference on User Modeling, Banff, Canada, 1999. [MARY00] Piergiulio Maryni and Franco Davoli. Load Estimation and Control in Best-Effort Network Domains, JOURNAL OF NETWORK AND SYSTEMS MANAGEMENT, Vol. 8, No. 4, December 2000 [MER02] "SHAAD: Adaptable, Adaptive and Dynamic Hypermedia System for content delivery ", David Mrida, Ramn Fabregat, Jose-Luis Marzo; Workshop on Adaptive Systems for Web Based Education (WASWE2002) Mlaga (Espaa), 28 may 2002. [MER02-1] "SHAAD: sistema hipermedia adaptable, adaptativo y dinmico para la entrega de contenidos hipermedia", David Mrida, Ramn Fabregat; accepted to the JENUI 2002. Cceres (Espaa), 10-12 july 2002.
Pagina 70
[MIS00] P.Misikangas, K.Raatikainen - Department of Computer Science, University of Helsinki, Finland Agent Migration Between Incompatible Platforms. ICDCS 2000. [MIS99] P.Misikangas - Department of Computer Science, University of Helsinki, Finland Intelligent Agents form Nomadic Users.In FDPW99. [MIS99-1] Pauli Misikangas, Mikko Mkel, Kimmo Raatikainen, Predicting QoS for Nomadic Applications Using Intelligent Agents, Impact99 Workshop. [MOH99] R. Mohan, J. R. Smith, and C.-S. Li. Adapting multimedia internet content for universal access. IEEE Trans. Multimedia, l(l):104 - 114, March 1999. [NOR00] Nortel Networks Corporation. FIPA-OS V1.3.3 Distribution Notes. Open Source, 2000. [OPP94] Oppermann R. (1994). Introduction. Adaptive User Support (Ed. Oppermann R.), Lawrence Erlbaum. Associates, Hillsdale, New Jersey, pp1-13. [OPP97] Reinhard Oppermann, Rossen Rashev, Kinshuk, Adaptability and Adaptativity in Learning Systems, Knowledge Transfer (Volume II) (Ed. A. Behrooz), 1997, pAce, London, UK, pp173-179 (ISBN 900427-015-X) [PE02] "Un sistema de tutora inteligente adaptativo considerando estilos de aprendizaje", Clara Ins Pea, Jose-L Marzo, Josep Lluis de la Rosa, Ramn Fabregat, enviado a IE2002, Vigo (Espaa), Noviembre 20-22, 2002. [PE02-1] "Student modeling using intelligent agents in a web-based teaching and learning environment", Clara Ins Pea, Jose-L Marzo, Josep Lluis de la Rosa, submitted to AIA2002, Mlaga (Spain), September 9-12, 2002. [PE02-2] "Intelligent Agents in a Teaching and Learning Environment on the Web", Clara Ins Pea, Jose-L Marzo, Josep-Lluis de la Rosa, (to be presented) ICALT2002, Kazan (Russia), September 9-12, 2002. [PER97] M. Perkowitz and O. Etzioni. Adaptive web sites: an AI challenge. In Proc. 15th Int. Joint Conf. AI, pages 16--23, 1997. [PER98] M. Perkowitz and O. Etzioni. Adaptive Web sites: automatically synthesizing Web pages. In Proceedings of Fifteenth National Conference on Artificial Intelligence, Madison, WI, 1998. [PER99] M. Perkowitz and O. Etzioni. Adaptive web sites: Conceptual cluster mining. In Proc. 16th Int. Joint Conf. AI, pages 264--269, 1999. [RAA99] Kimmo Raatikainen, Lassi Hippelinen, Heimo Laamanen, Matti Turunen, Monads Adaptation Agents for Nomadic Users, World Telecom '99 [RAA99-1] K.Raatikainen - Nokia, Sonera Finland, University of Helsinki. Monads Response to OMG Request for Information on Agent Technology in OMA. July 30, 1999. [ROD01] P. Rodriguez, C. Spanner, and E. W. Biersack, " Analysis of Web Caching Architectures: Hierarchical and Distributed Caching" Published in IEEE/ACM Transactions on Networking, August 2001) [ROD99] P. Rodriguez, C. Spanner, and E. W. Biersack, "Web caching architectures: Hierarchical and distributed caching," in Proceedings of the 4th International Web Caching Workshop, San Diego, April 1999 [SCH95] D. Schwabe, G. Rossi. The Object-Oriented Hypermedia Design Model.
Pagina 71
Communications of the ACM, Vol. 38, nr. 8, pp. 4546, 1995. [SLI98] C.-S. Li, R. Mohan, and J. R. Smith. Multimedia content description in the InfoPyramid. In IEEE Proc, Int. Conf. Acoust., Speech, Signal Processing (ICASSP), Seattle, WA, May 1998. Special session on Signal Processing in Modern Multimedia Standards. [SMI98] J.R. Smith, R. Mohan, and C.S. Li, "Transcoding internet content for heterogeneous client devices,"Proc. IEEE Int'l. Conf. Circuits and Systems, Monterey, CA, June 1998. [SMI99] J. R. Smith, R. Mohan, and C-S. Li. Scalable Multimedia Delivery for Pervasive Computing, ACM Multimedia, Orlando, FL, November 1999. [SPE96] Spero, S., Analysis of HTTP Performance Problems. http://www.w3.org/Protocols/HTTP/1.0/HTTPPerformance.html , July 1994. [SPY02] Spyglass - http://www.opentv.com/redirect.html [TOU96] Touch, J., J. Heidemann, K. Obraczka, "Analysis of HTTP Performance," USC/Information Sciences Institute, June, 1996 [W3C99] World Wide Web Consortium, Web Content Accessibility Guidelines 1.0, http://www.w3.org/TR/WAI-WEBCONTENT [W3C99-1] W3C Composite Capability/Preference Profiles (CC/PP). http://www.w3.org/TR/NOTE-CCPP/ [YANG00] Yudong Yang, Jinlin Chen, and Hongjiang Zhang, Adaptive Delivery of HTML Contents, 9th International World Wide Web Conference The Web: The Next Generation, Amsterdam, 2000.
Pagina 72