Вы находитесь на странице: 1из 72

SHAAD Sistema Hipermedia Adaptable, Adaptativo y Dinmico para la entrega de contenidos.

David V.H. Mrida Tutor: Ramn Fabregat Gesa

Proyecto de Investigacin Programa de doctorado Tecnologas de la Informacin Departament de Electrnica, Informtica i Automtica Universitat de Girona

Girona, Junio 2002

A Natalia, hermosa compaera, que me ha brindado su apoyo y amor en todo momento. A mi hija Sabina, que con su aire infantil es motivo da a da de nuevos horizontes.

Reconocimientos
En primer lugar, quiero agradecer a la Universitat de Girona por haberme dado la oportunidad de realizar estos estudios al concederme una beca de investigacin. Tambin quiero agradecer a mi director de tesis Dr. Ramn Fabregat Gesa por su constante apoyo y valioso asesoramiento durante la realizacin de este trabajo de investigacin. Por ltimo, agradecer al grupo de investigacin de Redes de Comunicaciones y Sistemas Distribuidos del Departament dElectrnica, Informtica i Automtica de la Universitat de Girona por su apoyo incondicional.

Indice
12INTRODUCCIN..........................................................................................................................8 CONSIDERACIONES GENERALES .......................................................................................10 2.1 REDES HETEROGNEAS ...............................................................................................................10 2.2 NOMADICIDAD - NOMADICITY ....................................................................................................11 2.3 CARACTERSTICAS PARA LA ADAPTACIN ...................................................................................13 2.4 ADAPTABILIDAD ADAPTATIVIDAD ...........................................................................................14 2.5 MODELOS PARA SISTEMAS HIPERMEDIA ......................................................................................15 2.5.1 The Dexter Hypertext Reference Model Modelo de Dexter .............................................15 3ESTADO DEL ARTE ..................................................................................................................19 3.1 PROPUESTAS GLOBALES..............................................................................................................19 3.1.1 Hewlett Packard Laboratories ...........................................................................................19 3.1.2 Microsoft Research China ..................................................................................................22 3.2 LAS CARACTERSTICAS Y PREFERENCIAS DEL USUARIO ...............................................................25 3.2.1 De Bra y Brusilovksy ..........................................................................................................25 3.2.1.1 Adaptacin de Contenidos (Content-Adaptation)...........................................................26 3.2.1.2 Adaptacin de Enlaces (Link-Adaptation)......................................................................26 3.2.1.3 AHAM (Adaptive Hypermedia Application Model): Modelo de Referencia para Hipermedia Adaptativa basado en el Modelo de Dexter ................................................................27 3.2.2 MAS-PLANG ......................................................................................................................29 3.2.3 Sitios Web Adaptativos .......................................................................................................30 3.2.4 Filtrado de Informacin Information Filtering ...............................................................33 3.2.5 Agentes de Informacin Inteligentes - Algoritmos de aprendizaje .....................................34 3.2.6 Conclusiones del apartado .................................................................................................35 3.3 EL DISPOSITIVO DE ACCESO DEL CLIENTE ....................................................................................36 3.3.1 Proyecto UMA Universal Multimedia Access .................................................................36 3.3.2 Proyecto MONADS.............................................................................................................38 3.3.3 InfoPyramid........................................................................................................................39 3.3.4 Digestor ..............................................................................................................................40 3.3.5 Conclusiones del apartado .................................................................................................41 3.4 TIPO DE ACCESO Y ESTADO DE LA RED .......................................................................................42 3.4.1 CAIDA ................................................................................................................................42 3.4.2 Estimaciones sobre redes Best-Effort .................................................................................43 3.4.3 Conclusiones del apartado .................................................................................................45 3.5 ESTADO DE CARGA DEL SERVIDOR ..............................................................................................46 3.5.1 Adaptacin de los Contenidos Web Web Content Adaptation .........................................46 3.5.2 Web Caching ......................................................................................................................48 3.5.3 Prefetching .........................................................................................................................49 3.5.4 Caching y Prefetching ........................................................................................................49 3.5.5 Web Servers ........................................................................................................................50 3.5.6 Conclusiones del apartado .................................................................................................50 4SHAAD: SISTEMA HIPERMEDIA ADAPTABLE, ADAPTATIVO Y DINMICO ..........52 4.1 ESTRUCTURA DE SHAAD ...........................................................................................................54 4.1.1 Submodelo Estado de carga del servidor ...........................................................................57 4.1.2 Submodelo Caractersticas y preferencias del usuario ......................................................58 4.1.3 Submodelo Acceso a la red: Dispositivo del cliente, Tipo de Acceso y Estado de la Red ..59 4.1.4 Modelo del SHAAD ............................................................................................................60 4.2 IMPLEMENTACIONES ...................................................................................................................61 4.2.1 Analizador de Contenidos...................................................................................................61 4.2.1.1 Fase 1 Transformacin del documento HTML a XHTML ............................61 4.2.1.2 Fase 2 Redireccin de les peticiones .................................................................62 4.2.1.3 Fase 3 Obtencin del perfil de adaptacin a aplicar ........................................62
Pagina 4

4.2.1.4 4.2.1.5

Fase 4 Obtencin del documento HTML adaptado .........................................65 Fase 5 Asignacin de valores..............................................................................65

4.2.2 El protocolo HTTP .............................................................................................................65 4.3 CONCLUSIONES ...........................................................................................................................66 56PLAN DE TRABAJO...................................................................................................................67 REFERENCIAS ...........................................................................................................................68

Pagina 5

Lista de Figuras
Figura 1 Espectro de adaptacin en sistemas de computadores Figura 2 Modelo de Dexter Figura 3 Ilustracin de la necesidad de presentation specifications en el camino de acceso (enlaces) as como en los componentes mismos. Figura 4 Descripcin de tres capas del modelo de Dexter implcitas en un sistema de hipertexto real Figura 5 Marco de trabajo bsico para el Sistema de entrega de contenido adaptativo de [MA00] Figura 6 Listado de los parmetros de entrada y los algoritmos de salida alrededor del Motor de Decisin de [MA00] Figura 7 Arquitectura del Sistema Figura 8 Estructura bsica del sistema AWCD Figura 9 Taxonoma actualizada de las tecnologas hipermedia adaptativas Figura 10 Modelo de AHAM Figura 11 Representacin de estructuras de navegacin y contenidos de aprendizaje en unidades docentes USD Figura 12 Arquitectura general del sistema Figura 13 Testbed utilizado en el proyecto UMA Figura 14 Modelo de Adaptacin de Monads Figura 15 Entrega de contenidos multimedia escalable para dispositivos Pervasive Computing Figura 16 Esquema de InfoPyramid Figura 17 Representacin del estado de la red bajo condiciones controladas del flujo de trnsito Figura 18 Componentes que actan en SHAAD Figura 19 Modelo del SHAAD Figura 20 Submodelo para SHAAD considerando el acceso a la red Figura 21 Submodelo para SHAAD considerando las caractersticas o preferencias del usuario Figura 22 Submodelo para SHAAD considerando el acceso a la red Figura 23 Modelo del SHAAD Figura 24 Fases del diseo 14 16 18 18 20 21 23 24 28 29 31 33 37 38 39 40 44 53 56 57 58 59 60 61

Pagina 6

Lista de Tablas
Tabla 1 rea de investigacin de los grupos descritos Tabla 2 Herramientas para definicin y soluciones adoptados por los diferentes grupos reseados Tabla 3 Valores de activacin de los perfiles Tabla 4 Parmetros que influyen en el tipo de perfil a aplicar Tabla 5 Esquema de los elementos enviados segn el perfil definido 53 55 63 64 64

Pagina 7

1 - Introduccin
Uno de los presentes desafos de Internet est dirigido a la problemtica surgida por la necesidad de una entrega adecuada de contenidos en un entorno web totalmente heterogneo. Esta heterogeneidad se plantea en trminos de necesidades-preferencias de los usuarios, tipos y capacidades de los dispositivos de acceso, ancho de banda y estado de la red. Caractersticas, que no son tenidas en cuenta por el servidor a la hora de entregar los contenidos web ricos en imgenes, audio y video. As por ejemplo, el servidor entrega el documento solicitado aunque el terminal utilizado (WebTV, Personal Digital Assistant (PDA) o telfono mvil) no pueda acceder a estos contenidos, debido a las limitaciones del monitor, de las capacidades de almacenamiento, de procesamiento o de acceso a la red. Por otra parte, esta entrega se realiza, muchas veces sin considerar el estado de carga que tiene el servidor en ese momento. Situacin que pone, an ms, en evidencia la carencia de una gestin inteligente de las redes. Para solucionar este problema se deben desarrollar alternativas que permitan un acceso universal a cualquier tipo de material, desde cualquier tipo de dispositivo y que tengan en cuenta caractersticas tales como las preferencias del usuario, el estado de carga de la red y/o del servidor. Ahora bien, una gestin inteligente de redes con calidad de servicio incide bsicamente en dos aspectos de las redes con estos requerimientos: La gestin de la red, es decir, la gestin de los recursos y fallos de la red. La calidad de servicio desde la ptica de las aplicaciones adaptativas

Bajo el primer concepto, se alinean todas las investigaciones que giran alrededor de tecnologas tales como ATM, MPLS, DiffServ, IntServ, etc. Mientras que en torno a las aplicaciones adaptativas, vemos que la problemtica es abordada desde la consideracin de las caractersticas antes mencionadas y las soluciones nos conducen al planteo referente al formato, al tipo de contenido o la estructura de la informacin a transferir. Muchos son los grupos de investigacin avocados a la tarea de la implementacin de sistemas adaptativos. Cada uno ha planteado sus soluciones teniendo en cuenta algunas o todas las caractersticas antes mencionadas (preferencias del usuario, tipo de dispositivo, red, etc.). As por ejemplo, podemos mencionar a: Grupos de investigacin de Hewlett Packard [MA00] y de Microsoft Research China [YAN00] que trabajan sobre un Adaptive Delivery Systems. Tienen en cuenta el tipo de dispositivo de acceso, el estado de la red y las preferencias del usuario. Paul de Bra [BRA99] [BRA99-1]. A partir sus conceptos sobre un Adaptive Hipermedia System (AHS) y teniendo en cuenta las preferencias del usuario (modelo del usuario), se plantea el cambio de los contenidos o de la presentacin de los nodos alterando la estructura de los enlaces. UMA (Universal Multimedia Acces) [APER01] [APER01-1]. Tiene en cuenta las nuevas clases de dispositivos inteligentes y portables. La finalidad del proyecto es permitir a los dispositivos de acceso con limitaciones en las capacidades de comunicacin, procesamiento y visualizacin acceder a cualquier contenido multimedia. MONADS [RAA99][RAA99-1][MIS99]. Est dirigido a solucionar la demanda de los servicios de datos anytime-anywhere-anyhow (en cualquier momento, cualquier lugar y de cualquier manera) a travs de las nuevas tecnologas de dispositivos mviles. La adaptabilidad de los servicios de datos a los cambios de entorno de los usuarios nmadas es el tema principal de este proyecto. Entendindose por nmada a los
Pagina 8

usuarios que cambian permanentemente de lugar y posiblemente de dispositivo y de tipo de acceso. En este proyecto los agentes inteligentes juegan un papel muy importante en la implementacin de la adaptabilidad. Abdelzaher y Bat [ABD99]. Proponen resolver el problema de la sobrecarga del servidor adaptando los contenidos entregados a las condiciones de carga de dicho servidor.

Como puede observarse, los distintos trabajos se concentran en algunas o todas las caractersticas mencionadas a la hora de realizar una adaptacin de contenidos. En el presente trabajo de investigacin se presenta una propuesta para la implementacin de un sistema integral, en el cual se consideren todas las caractersticas anteriormente mencionadas. Es decir, necesidades y/o preferencias de los usuarios, tipos y capacidades de los dispositivos de acceso, ancho de banda, estado de la red y estado de carga del servidor. El sistema, a su vez, intenta tipificar a travs de un modelo nico, las diferentes variaciones de un sistema para la entrega de contenidos adaptados en el que se consideren las caractersticas mencionadas arriba. Por otra parte, trata de aunar los conceptos vertidos en las distintas lneas de investigacin a fin de reutilizar el marco terico desarrollado y generalizarlo en estos mbitos de trabajo. Queda claro, en los captulos posteriores, como el entorno de contenidos adaptativos es abordado y denominado de diferentes maneras dependiendo del punto de anlisis que se lleve adelante. As por ejemplo, Paul de Bra habla de Sistemas Hipermedias Adaptativos cuando trata la modelizacin del usuario; UMA, MONADS y el grupo de Hewlett Packard, aborda la entrega de contenidos adaptativos; en el caso de los trabajos sobre la carga del servidor tratan con conceptos tales como las web adaptativas o la adaptacin de contenidos. El sistema propuesto, extiende los diferentes conceptos vertidos en cada rea de investigacin a fin de conseguir trabajar con uno tan simple y a la vez general como lo es la adaptacin de contenidos en entornos de red heterogneo y as plantear un sistema hipermedia adaptativo en lneas generales. En el Captulo 1 se exponen los conceptos que delinearn el marco general de trabajo para nuestro sistema. En el Captulo 2, se exponen algunos de los trabajos realizados por diferentes grupos de investigacin en el campo de la adaptacin, los cuales sern presentados de acuerdo a la caracterstica adoptada como centro del problema a resolver (caractersticas/preferencias del usuario, tipo de dispositivo de acceso, etc.). Aqu se resaltar, especialmente, el enfoque tenido en cuenta por estas investigaciones, los aspectos ms importantes de trabajo y las soluciones adoptadas en cada caso. En el Captulo 4, presentamos la propuesta de SHAAD - Sistema Hipermedia, Adaptable, Adaptativo y Dinmico - para la entrega de contenidos adaptativos. En este punto del trabajo, veremos como a partir de submodelos, planteados para cada una de las caractersticas consideradas, llegamos a un modelo final que ser el que adoptaremos para nuestro sistema. Se expone tambin en este captulo un avance de la implementacin de nuestro Analizador de Contenidos y las consideraciones hechas sobre el protocolo HTTP, como herramienta para la definicin de las caractersticas del usuario y el tipo de dispositivo de acceso. Finalmente, se exponen los futuros trabajos a realizar a travs de un plan de trabajo que tiene como objetivo consolidar el funcionamiento del SHAAD.

Pagina 9

2 - Consideraciones generales
2.1 Redes Heterogneas
En primer lugar, analizaremos conceptos generales con el fin de justificar nuestro entorno de aplicacin. El porqu? de la necesidad de la consideracin de las redes heterogneas y el anlisis de conceptos muy generalizados sobre acceso universal a la red (Universal Access). Actualmente, el crecimiento explosivo de Internet se ha reflejado, tanto en el incesante incremento de la informacin existente como en la diversidad y heterogeneidad existente en lo que a preferencias del usuario final, dispositivos de acceso y conexiones se refiere. Muchas son las nuevas tecnologas disponibles como dispositivos de acceso a la red. Estas van desde simples ordenadores de escritorio hasta los nuevos dispositivos mviles, como son los handheld computers o los PDAs (Personal Digital Assistans). De igual manera, los distintos tipos de conexin a la red, se diversifican dia a da. Y as, se ha transitado desde las viejas conexiones va mdem, con anchos de banda de 9.6K - 28.8, pasando por la conexiones ISDN, DSL o cable mdem, con anchos de banda intermedios entre 128K - 1.5M, hasta las conexiones de las redes Ethernet de 10M - 100M. Esta diversidad, desde el punto de vista tecnolgico, tiene sus consecuencias. Los contenidos multimedia, paralelamente en los sitios web, se han incrementado notablemente con el fin de utilizar la potencialidad provista por estas nuevas tecnologas. sto, no signific necesariamente el hecho de considerar diferentes diseos para los diferentes tipos de clientes. Y como resultado, nos encontramos diariamente con las frustrantes experiencias de las lentas entregas de contenido o la incapacidad de ver ciertos tipos de contenidos multimedia. La falta de la infraestructura necesaria para acomodar este crecimiento heterogneo ha planteado un nuevo objetivo: la necesidad de generar los mecanismos necesarios para que cualquier usuario sobre Internet pueda tener un acceso efectivo y universal a la informacin. En este punto, vale la pena rescatar dos conceptos muy generalizados: Acceso Universal (Universal access) [MA00] [W3C99]. Es el concepto lanzado por la comunidad investigadora para dirigir las cuestiones tcnicas que permitan el acceso a la informacin en entornos de red heterogneos, acomodando las necesidades de los usuarios y las restricciones de los dispositivos de los clientes y las caractersticas de la red. El objetivo del Acceso Universal es proveer la infraestructura de Internet necesaria para permitir a los usuarios acceder a cualquier informacin sobre cualquier red desde cualquier lugar y a travs de cualquier tipo de dispositivo del cliente. Para alcanzar este objetivo, los contenidos web podran necesitar ser transformados en representaciones adecuadas antes de ser entregadas a los clientes. Es decir, estamos hablando de una entrega de contenidos que se adecue a las condiciones particulares en un dado momento. Entrega adaptativa de contenido (Adaptive Content Delivery). Es la tecnologa que transforma los contenidos web y los esquemas de entrega de acuerdo a la heterogeneidad de los visualizadores y cambiando las condiciones a fin de
Pagina 10

posibilitar un acceso universal. El objetivo de la Entrega adaptativa de contenido es tener en cuenta estas condiciones cambiantes y heterogneas para proveer la mejor accesibilidad y calidad de servicio de la informacin.

2.2 Nomadicidad - Nomadicity


El diccionario define a Nmada (Nomad1) [KLE00] como aquella persona que constantemente se mueve de un lugar a otro, un vagabundo. Por Nomadicidad (Nomadicity) entendemos la habilidad de las personas para moverse fcilmente desde un lugar a otro, manteniendo el acceso a la totalidad de un conjunto de servicios mientras estn en movimiento, en sus paradas intermedias y en sus destinos. Algunas implementaciones son diseadas con el concepto de Nomadicity como objetivo central. Los telfonos mviles son uno de los ejemplos ms notables. Otras, son igualmente balanceadas entre el abastecimiento a los nmadas y el servicio a otro tipo de necesidades. La agenda electrnica y los cajeros automticos caen dentro de esta categora. Por ltimo, existen aquellas que no son nmadas. La computadora de escritorio personal es un dispositivo de tal tipo. De esta manera, podemos establecer que la caracterstica de Nomadicity es el soporte de los nmadas o como llamaremos de forma estndar nomads. Ahora bien, podramos preguntarnos qu motiva la Nomadicity? Es evidente que el vasto desarrollo tecnolgico ha impactado en la disminucin de los costos asociados con la transaccin y la conversacin, y que las comunicaciones mediante computadoras son los desarrollos actuales en mayor progreso. Pero, a pesar de esto, las personas an viajan y se renen en persona. Esto tiene su justificacin, por ejemplo, en situaciones de este tipo: Productividad incrementada: si una organizacin necesita contactos personales en un lugar, es mucho ms efectivo proveer la capacidad de viajar a una persona ubicada centralmente que tener a una emplazada en el lugar. Los servicios a clientes es un ejemplo obvio. Si el servicio puede ser provisto sin tener permanentemente un ingeniero en el sitio, los costos son ms bajos. El contacto personal: otro motivador es el requerimiento social por el contacto personal. El vendedor va hacia el cliente, estrecha su mano y le muestra las facilidades. Amigos que se juntan para cenar. Compaeros de trabajo que se renen a fin de estrechar sus relaciones. En todas estas situaciones el requerimiento de trasladarse est originado en el deseo de encontrarse, tomar medida de y disfrutar de la compaa de otros. Ambiente personal: la mayor parte de nuestras vidas nuestra familia, negocios, entorno social, etc. se desarrollan en diferentes lugares. La gente se mueve entre estos lugares como lo hacen entre los diferentes aspectos de nuestras vidas. Hacer las cosas apropiadas en los sitios apropiados es la clave para muchas personas para poder organizar sus vidas. Interactividad: muchas de las comunicaciones en interacciones humanas intensas es no verbal y por lo tanto requiere de un contacto persona a persona. Hay muchas situaciones en donde el dar y el tomar va ms all de las palabras. La

Nomads y Nomadicity: en el presente informe usaremos estos dos trminos en lugar de su traduccin literal para seguir con las denominaciones internacionalmente estandarizadas.

Pagina 11

entrevista de evaluacin personal en los negocios, las reuniones de gobierno, y los encuentros familiares para decidir sobre las vacaciones son los ejemplos ms comunes de la necesidad de interactividad. El lugar: por varias razones, la gente frecuentemente lleva adelante sus negocios en otros lugares ms que en sus oficinas. Algunos sitios son preferibles frente a otros. Por otro lado las personas muchas veces se encuentran en medio de situaciones con oportunidades de negocios sin haberlo previsto.

Por todas estas situaciones, podemos inferir que la Nomadicity es actualmente uno de los fenmenos que han tenido ingerencia en el desarrollo de las nuevas tecnologas. La necesidad de comunicarse y las demandas de acceso a los servicios de informacin independientemente del lugar o situacin han llevado a los usuarios a la utilizacin cada vez mayor de la diversidad de dispositivos de acceso a la red que hoy existe. As, en este entorno de nmadas han surgido consecuentemente una serie de desafos a solucionar. Podemos mencionar por ejemplo: Independencia de ubicacin: actualmente nos comunicamos con los individuos en funcin de su ubicacin o de sus instrumentos de comunicacin; es decir, el telfono mvil, fax, u ordenador ms cercano. Si pudiramos comunicarnos con las personas independizndonos de su ubicacin, dirigiendo de forma transparente nuestras comunicaciones al dispositivo apropiado en el lugar apropiado, esto generara entonces un ambiente en el cual las personas se comunicaran con otras personas, y no con los dispositivos que ellos usan. Independencia del dispositivo: un usuario nmada no siempre acceder a los servicios desde el mismo lugar o a travs del mismo dispositivo. De esta manera la Nomadicity deber soportar la independencia del dispositivo. Acceso de amplio espectro: un componente esencial de la Nomadicity es que los individuos permanezcan conectados tanto como ellos deseen y desde donde ellos deseen. Por esta razn, los dispositivos de comunicacin y los canales de los que dependen la conectividad deben permitir un amplio espectro de acceso. Seguridad: la Nomadicity impone requisitos de seguridad especial, particularmente con todo lo que se refiere a identificacin, certificacin, y facturacin. Puesto que el dispositivo no es la persona, la tecnologa puede ocultar la identidad de las partes que se comunican. Garantizar que el individuo conectado en un extremo de la comunicacin sea quien dice que es, es uno de los puntos crticos para establecer un acceso efectivo. Similarmente, cuando el individuo se encuentra en movimiento, cambiando de dispositivos y de ubicacin, otro gran nmero de problemas de seguridad son resaltados. Interfaz amigable: la aceptacin pblica de las nuevas tecnologas principalmente est basada en la medida en que estas tecnologas sean familiares y consistentes con otras tecnologas que son similares a otros modelos ya conocidos por los usuarios. Es el caso del xito de los telfonos mviles, en los que la imagen que el sistema presenta al usuario es familiar y muy parecida a la de los telfonos ya conocidos. Particin (Partitioning): una persona podra usar el mismo dispositivo (o conjunto de dispositivos) para acceder a sus servicios en varios ambientes personales separados.

Pagina 12

A partir de todas estas caracterizaciones referentes a un entorno de usuarios nmadas, se pone an ms en evidencia la necesidad de considerar entornos heterogneos y consecuentemente redes heterogneas. De esta forma, si nuestro anlisis parte desde el explosivo desarrollo tecnolgico; o si parte desde la necesidad de considerar los ricos contenidos multimedia existentes en la web y la necesidad de adecuarlos a las nuevas tecnologas; o desde el fenmeno de los entornos de usuarios nmades y la necesidad de adecuar la tecnologa a ellos, vemos que todos en conjunto apuntan a un mismo lugar: la necesidad de adecuar la informacin al usuario, al dispositivo y la red.

2.3 Caractersticas para la adaptacin


En este apartado, vamos a definir las caractersticas a considerar a la hora de realizar una adaptacin de contenidos, es decir, los valores de entrada de nuestro sistema hipermedia adaptativo. Podemos clasificar estas caractersticas en: 1. Las caractersticas y preferencias del usuario. Bajo este concepto se incluye todo lo referente a preferencias y conocimientos del usuario. Por preferencias entendemos todo lo relativo a la manera de recibir el material hipermedia (explicita o resumida), a las caractersticas de aprendizaje (si es un usuario textual o visual), a las caractersticas personales (si es un usuario extrovertido o introvertido), etc. Y por conocimiento, todo lo relativo a conocimiento previo o evolutivo. 2. El dispositivo de acceso del cliente. Como expresamos anteriormente, paralelamente con la creciente expansin de Internet se ha producido un amplio desarrollo tecnolgico de los dispositivos de acceso a la red. Estos dispositivos presentan grandes diferencias tales como su capacidad de almacenamiento, poder de procesamiento, resolucin de pantallas, etc. Nos encontramos ante una nueva problemtica: el tener que entregar los ricos contenidos multimedia disponibles a una amplia gama de dispositivos y/o clientes que en muchos de los casos no tendrn las capacidades para poder tratarlos adecuadamente. 3. Tipo de acceso a la red. Anchos de banda diferentes generan un nueva caracterstica que hay que considerar: la velocidad de acceso a la red. 4. Estado de la red. A la diversidad de tipos de conexin se suma el estado de congestin que la conexin utilizada puede presentar en un momento dado. La carga que tiene la conexin en todo momento no es uniforme. Es decir, no podemos inferir a partir del hecho de disponer de un buen ancho de banda, el tener de forma permanente un buen estado de la conexin. 5. Estado de carga del servidor. Por parte de los usuarios es ms que conocida la experiencia de situaciones de accesos fallidos o rechazados por parte del servidor ante la consulta de algn material multimedia. Esta situacin muchas veces es ocasionada por un exceso de carga en dichos servidores como consecuencia de una inusitada cantidad de peticiones. Para solucionar dicha sobrecarga puede ser preferible entregar contenidos de menor calidad antes que tener que rechazar o generar una falla en las conexiones que se estn realizando.

Pagina 13

2.4 Adaptabilidad Adaptatividad


En este punto vamos a rescatar los conceptos existentes en torno a la Adaptabilidad o la Adaptatividad de los contenidos en los sistemas hipermedia. El trmino de adaptatividad ha sido muy utilizado por distintos autores en diferentes mbitos. Dependiendo del entorno considerado varan los objetivos perseguidos por tal adaptacin. Abdelzaher [ABD99] considera la adaptacin de contenidos web como un mecanismo para mejorar el rendimiento de un servidor sobrecargado. Wei-Ying Ma [MA00] hace consideraciones sobre la entrega de contenidos adaptados en ambientes heterogneos a fin de mejorar la accesibilidad de los contenidos. Brusilovsky [BRU01] define un Sistema Hipermedia Adaptativo y utiliza un modelo de objetivos, preferencias y conocimientos, que construye para cada usuario, para adaptar los contenidos a sus necesidades. De igual manera, son diferentes las clasificaciones realizadas para los sistemas hipermedia. As, Oppermann [OPP97] plantea que el concepto de adaptacin ha sido una de las cuestiones importantes de la investigacin dentro de los sistemas de aprendizaje en los ltimos aos. La investigacin ha mostrado que la aplicacin de adaptacin puede proveer mejores entornos de aprendizaje en tales sistemas. Dos clases de sistemas [OPP94] han sido desarrolladas para dar soporte al usuario en sus tareas: Sistemas Adaptables: permiten al usuario cambiar ciertos parmetros del sistema y adaptar el comportamiento de dicho sistema consecuentemente. Sistemas Adaptativos: Se adaptan al usuario automticamente basndose en las suposiciones que el sistema realiza de las necesidades del usuario.

A partir de esta clasificacin, pone de manifiesto, dentro de estos dos extremos, el espectro del concepto de adaptacin para sistemas de computadores, Figura 12. Si bien es cierto que, el espectro cubre un amplio rango de posibilidades existentes para el concepto de adaptacin, encontramos mucho ms adecuada la caracterizacin realizada por De Bra [BRA99] al referirse a los sistemas hipermedia adaptativos.

Figura 1 Espectro de adaptacin en sistemas de computadores

En [BRA99] se tiene en cuenta las preferencias del usuario como variable que decide la adaptacin, clasifica los entornos hipermedias o los sitios Web construidos con la capacidad de realizar algn tipo de personalizacin en:

Figura extractada de [OPP97]

Pagina 14

Hipermedias adaptables: sistemas en los que el usuario puede proveer algn perfil (por ejemplo a travs de cuestionarios) para que el sistema pueda proveer una versin de la aplicacin hipermedia teniendo en cuenta ese perfil. Esta configuracin, por parte del usuario, podra incluir preferencias de presentacin (colores, tipo de media, estilos de aprendizaje, etc.) y el background del usuario (calificaciones, conocimiento relativo a los conceptos, etc.) Hipermedias adaptativos: sistemas que monitorizan el comportamiento de los usuarios y adaptan la presentacin teniendo en cuenta dicho comportamiento. En estos casos la evolucin, tanto en preferencias como en conocimientos, podra ser captada o deducida por el sistema a partir de los accesos realizados a las pginas. Por otra parte, muchas veces podran necesitar cuestionarios o test a fin de obtener informacin ms fiable respecto a las preferencias del usuario. La mayor parte de la adaptacin es realizada, sin embargo, sobre la base de las acciones de navegacin del usuario y tambin considerando el comportamiento de otros usuarios. Hipermedias dinmicos: El comportamiento de los usuarios es monitorizado como en los sistemas hipermedia adaptativos. En este caso, la adaptacin, en lugar de ser cambiada seleccionando presentaciones predefinidas, es generada a partir de unidades atmicas de informacin. Es decir, es reconstruida dinmicamente a partir de los objetos individuales que componen la pgina tomando los que son mas adecuados en base a las caractersticas del usuario.

En el presente trabajo, nos sujetaremos a esta clasificacin por considerarla la ms adecuada y representativa de nuestras caracterizaciones.

2.5 Modelos para sistemas hipermedia


Existen diversos modelos propuestos para la representacin de los sistemas hipermedia, como por ejemplo: Tower model [BRA92], HDM [GAR93] y OOHDM [SCH95]. Sin embargo, haremos referencia al ms importante y ms utilizado en un amplio entorno de sistemas hipermedia: el Modelo de Dexter o ms conocido como The Dexter Hypertext Reference Model, [HAL90] y [HAL94].

2.5.1 The Dexter Hypertext Reference Model Modelo de Dexter


El Modelo de Referencia de Dexter surge como resultado de dos pequeos workshops sobre hipertexto. El primero fue realizado en Octubre de 1998, en el Dexter Inn en New Hampshire, de aqu el nombre del modelo. Gran parte de la discusin en estos workshops estuvo dirigida a encontrar las abstracciones comunes de la mayora de los sistemas hipertexto. Es decir, un intento de definir, tanto formal como informalmente, las abstracciones importantes, encontradas en el amplio rango de sistemas de hipertexto. En este punto, cabe sealar que los trminos hipertexto e hipermedia fueron aunados para la modelizacin. En general, con hipertexto se hace referencia a los sistemas de slo texto y con hipermedia a los sistemas que soportan mltiple media (video, imagen y sonido). Para el caso de la definicin del Modelo de Dexter, el trmino hipertexto fue utilizado genricamente para referir tanto a los sistemas de solo texto como a los multimedia.
Pagina 15

Otro importante punto de atencin de estos workshops fue el intento de encontrar una terminologa comn para el campo del hipertexto. Difcil tarea, al carecer de abstracciones comunes entre los diversos sistemas analizados en ese momento. As por ejemplo, el trmino nodo result ser especialmente difcil de homogeneizar debido a la extrema variacin de su uso en los diferentes sistemas. De esta manera, y a fin de evitar confusin, el modelo no usa trminos conflictivos como nodo, prefiriendo trminos neutrales como componente. El modelo descrito, Figura 23, est dividido en 3 capas: 1. Runtime: describe los mecanismos para soportar la interaccin de los usuarios con el hipertexto. 2. Storage: describe los mecanismos a travs de los cuales los componentes y los enlaces estn relacionados con el fin de conformar la red de hipertexto. 3. Within-component: cubre los contenidos y estructuras internas de los componentes del hipertexto.

Presentacin del hipertexto; interaccin del usuario; dinmicos

Capa Runtime

Presentation specifications

Capa Storage
Una Base de datos que contiene una red de nodos y enlaces

Focos de atencin del Modelo de Dexter

Anchoring

Capa Within-Component
El contenido / estructura dentro de los nodos

Figura 2 Modelo de Dexter

El foco principal de atencin del modelo est en la capa de storage, que modela la estructura de una red bsica del tipo nodo/enlace y representa una base de datos que est compuesta de una jerarqua de componentes contenedores de datos, los cuales estn interconectados por enlaces (links) relacionales. Los componentes contienen las porciones de texto, grficos, imgenes, animaciones, etc. que conforman el contenido bsico en una red de hipertexto. Esta capa se concentra en los mecanismos, a travs de los cuales los componentes y enlaces estn vinculados, para conformar las redes de hipertexto. Los componentes son tratados en esta capa como contenedores genricos de datos. No se modela ninguna estructura dentro del contenedor, por lo cual, la capa storage no realiza ninguna diferenciacin entre componentes de texto o componentes grficos.

Figura extractada de [HAL94]

Pagina 16

Por el contrario, la capa within-component del modelo se ocupa especficamente de los contenidos y estructuras internas de los componentes del hipertexto. Esta capa no est desarrollada dentro del modelo de Dexter, quedando abierta la variedad de posibles contenidos / estructuras que se pueden incluir en un componente. Texto, grficos, animaciones, simulaciones, imgenes, y cualquier otro tipo de datos han sido utilizados como componentes en los sistemas de hipertexto actuales. Por lo que resulta difcil intentar que un modelo genrico cubra todos estos tipos de datos. En su lugar, el modelo de Dexter trata la estructura dentro del componente (within-component structure) como constituida fuera del modelo. Existen dos aspectos crticos del modelo de Dexter. El primero se presenta en la interfaz entre las capas storage y within-component. Y el segundo aspecto crtico es la interfaz entre la capa storage y la capa runtime. En el primer caso, el sistema de hipertexto requiere de mecanismos para localizar la ubicacin o tem dentro del contenido de un componente individual. En el modelo de Dexter, este mecanismo es conocido como anchoring. Las capas de storage y within-component tratan el hipertexto como una estructura esencialmente pasiva. Los sistemas de hipertexto, sin embargo, van ms all de esto en el sentido de que proveen las herramientas para que el usuario pueda acceder, ver y manipular la estructura de la red. Esta funcionalidad est representada por la capa runtime del modelo. Y, como en el caso de la estructura within-component, la serie de posibles herramientas para acceder, ver y manipular las redes de hipertexto son tantas y tan diversas para ser manipuladas por un modelo genrico. Por lo tanto, el modelo de Dexter solo provee un modelo estructural y simple de los mecanismos para presentar un hipertexto al usuario para ver y editar. Esta presentacin de mecanismos captura lo esencial de la dinmica, los aspectos de la interaccin de los sistemas de hipertexto, pero no intenta cubrir los detalles de la interaccin con el hipertexto. Y as, como en el caso del anchoring, el segundo aspecto crtico del modelo es la interfaz entre la capa storage y runtime. En el modelo de Dexter esta interfaz se realiza usando la nocin de presentation specifications. Presentation specification es un mecanismo por el cual la informacin acerca de cmo un componente/red (component/network) es presentado al usuario puede ser codificada dentro de la red de hipertexto en la capa de storage. Por lo tanto, la forma en la cual un componente es presentado al usuario puede ser una funcin no slo de la herramienta de hipertexto especfica, que est haciendo la presentacin (por ejemplo la capa runtime especfica), sino que puede ser tambin una propiedad del componente mismo y/o del camino de acceso (enlace link) dado para ese componente. En la Figura 3, [HAL94]4, se ilustra la importancia de los mecanismos de presentation specifications. Este ejemplo pone de manifiesto tambin la utilidad del modelo como representacin de un entorno adaptativo, ya que, sobre la base del perfil del usuario muestra la informacin de una u otra manera. En la figura, observamos un componente de animacin existente en una computadora de entrenamiento de hipertexto. La animacin puede ser accedida desde dos componentes. Un componente teacher y otro componente student. Cuando la animacin es accedida a travs del enlace del componente student, esta animacin debe ser ejecutada como tal. En caso de ser accedida por el componente teacher, la animacin debera ser lanzada en modo de edicin para poder ser modificada. Con el objetivo de separar los dos casos, la capa runtime necesita acceder a la informacin de presentacin codificada dentro del enlace en la red. Las presentation specifications son una forma genrica de hacer justamente esto. As como vimos con el anchoring,

Figura extractada de [HAL94]

Pagina 17

presentation specifications es una interfaz que permite a la capa storage comunicar en una forma genrica con la capa runtime sin violar la separacin entre las dos capas.

Figura 3 Ilustracin de la necesidad de presentation specifications en el camino de acceso (enlaces) as como en los componentes mismos.

Por ltimo, a travs de la Figura 45, se intenta mostrar como varias capas del modelo de Dexter estn representadas dentro de un sistema de hipertexto tpico. La figura describe una red de hipertexto de 3 nodos y 1 enlace. La capa de storage contiene 4 entidades: los tres componentes (nodos) y el enlace. Los contenidos (texto y grficos) para los componentes estn localizados a la derecha de la capa de storage en la capa withincomponents. En la capa runtime, el componente de grficos est siendo presentado al usuario. El enlace es lanzado desde este nodo a travs del puntero de la pantalla del ordenador.

Figura 4 Descripcin de tres capas del modelo de Dexter implcitas en un sistema de hipertexto real

Figura extractada de [HAL94]

Pagina 18

3 - Estado del arte


3.1 Propuestas Globales
Antes de comenzar las descripciones individuales de los distintos grupos de investigacin y sus respectivos focos de atencin (caractersticas del usuario, tipo de dispositivo de acceso, tipo de conexin / estado de la red y estado de carga del servidor), vamos a realizar una resea de algunos trabajos que consideran un entorno global respecto a estas caractersticas. Realizando de esta manera, una labor dentro de un marco de suposiciones similares a las tratadas por nuestra propuesta. As, a lo largo de este apartado se realiza un anlisis y descripcin detallados de dos grupos de investigacin: Microsoft China [YAN00][CHE00] y Hewlett Packard [MA00], no significando esto que sean los nicos a tener en cuenta.

3.1.1 Hewlett Packard Laboratories


[MA00], a nuestro entender, es un trabajos muy interesante en el marco de propuestas para la entrega de contenidos adaptativos en entornos de redes heterogneas. El grupo de trabajo de Hewlett Packard, propone un marco de trabajo en el que se tienen en cuenta: las preferencias y necesidades del usuario, los tipos de dispositivos del cliente y conexiones a la red. Es interesante resaltar, que este trabajo no da muestras de tener en cuenta la caracterstica relativa a la carga del servidor y tiene como objetivo mejorar la accesibilidad de los contenidos y la calidad de servicio percibida durante el acceso a la informacin bajo condiciones cambiantes de visualizacin y de red. Este marco de trabajo incluye algoritmos para la adaptacin de contenidos, mtodos para la caracterizacin del ancho de banda de la red y las capacidades del cliente y un motor de decisin que determina cuando y como debe adaptar los contenidos. El planteamiento del problema se realiza desde dos perspectivas: Desde el lado del cliente (On the client side): dispositivos y tipo de conexin. Desde el lado del servidor (On the server side): sitios Web con contenidos multimedia sin diferenciar de forma individual el dispositivo del cliente y su acceso a la red.

La arquitectura planteada por [MA00] se muestra en la Figura 56 y est constituido por tres mdulos principales: 1. Mdulo de Caracterizacin del Usuario-Cliente-Red (User/client/network-discovery) 2. Motor de Decisin (Decision Engine) 3. Algoritmos para la Adaptacin de Contenidos (Content adaptation algorithm)

Figura extractada de [MA00]

Pagina 19

Figura 5 Marco de trabajo bsico para el Sistema de entrega de contenido adaptativo de [MA00]

El Mdulo de Caracterizacin del Usuario-Cliente-Red es el encargado de detectar y coleccionar la informacin que el Motor de Decisin necesita conocer a fin ejecutar un algoritmo de adaptacin de contenidos en particular. En este esquema, el Motor de Decisin es el centro fundamental del sistema y las caractersticas a definir son puntualizadas en forma clara a travs de la Figura 67 Ahora bien, dependiendo donde el Motor de Decisin y los algoritmos de adaptacin de contenidos estn ubicados, [MA00] enuncia las siguientes arquitecturas para el sistema: Adaptacin basada en Servidor: Aqu el servidor es el responsable de la deteccin de las capacidades del cliente y de las caractersticas de su ancho de banda disponible. Basndose en esto decide la mejor estrategia de adaptacin a seguir. Esta arquitectura tiene la ventaja de permitir tanto una adaptacin de contenidos esttica (off-line) o una dinmica (on-the-fly). Adaptacin basada en Proxy. Aqu el cliente se conecta a un proxy que hace la peticin al servidor como un intermediario. El proxy intercepta la respuesta del servidor, decide y ejecuta la adaptacin y enva el contenido transformado al cliente. En este caso se considera que el ancho de banda entre proxy y servidor es mucho mayor que entre cliente y proxy, por lo cual el tiempo de recuperacin del contenido original desde el servidor al proxy es insignificante.

Con respecto a las tcnicas de adaptacin consideradas en este trabajo, se mencionan cinco tecnologas de procesamiento para realizar una entrega de informacin inteligente: 1. Information abstraction. Su objetivo es reducir el ancho de banda requerido para la entrega del contenido, a travs de una compresin de datos y conservando la informacin de alto valor para el usuario, por ejemplo, resumiendo texto, generacin de imgenes pequeas, etc.

Figura extractada de [MA00]

Pagina 20

Figura 6 Listado de los parmetros de entrada y los algoritmos de salida alrededor del Motor de Decisin de [MA00].

2. Modality transformation. Es el proceso de transformacin de contenidos de modo a otro, de modo tal que el contenido resulte til para un cliente particular. El objetivo principal de esta tcnica es adaptar la representacin contenidos a las capacidades del cliente, por ejemplo, transformar video en conjunto de imgenes.

un en de un

3. Data transcoding. Es el proceso de conversin del formato de datos de acuerdo a las capacidades del cliente, por ejemplo, convirtiendo el formato de las imgenes GIF a JPEG, o de color a una escala de grises, o formato de audio WAV a MP3, o formato de un documento Postscritp a PDF, etc. 4. Data Prioritization. Tiene como objetivo distinguir la parte ms importante del dato menos importante, tal que, diferentes niveles de calidad de servicio pueden ser provistos cuando se entregue el dato a travs de la red, por ejemplo, dejar
Pagina 21

de lado los datos menos importantes ante condiciones de restriccin de ancho de banda. 5. Purpose Classification. Los contenidos de las pginas Web tpicas contienen mucha informacin y objetos media que son redundantes o podran ser de poco inters para el usuario. La tcnica propone clasificar la entrega de informacin removiendo los objetos redundantes o priorizndolos de acuerdo a su grado de importancia. Finalmente, nos queda mencionar de este trabajo las metodologas consideradas para la definicin de las preferencias del usuario, las capacidades del cliente, y las caractersticas de la red. Estas son: Anlisis de la peticin. La informacin contenida en la cabecera de la peticin http, ha sido considerada por informacin que puede recuperarse a partir de sta sobre el dispositivo del cliente. En [MA00] se seala el estndar que est desarrollando la World Wide Web Consortium (W3C) para los procesos de definicin de las capacidades del cliente y preferencias del usuario [W3C99-1]. Sesiones de ratreo (Tracking sessions). Utiliza el conjunto de herramientas dado por el UserAgent String transmitido por el navegador, la direccin IP, y una cookie opcional para establecer un identificador (ID) para el usuario que es mantenido durante la sesin. Mediciones automticas. En el servidor son ejecutadas dinmicamente mediciones a fin de obtener informacin relativa a la carga y el ancho de banda del sistema. Recomendacin del usuario. Utilizan una interfaz para que el usuario enve informacin relativa a sus preferencias, capacidades del dispositivo y tipo de acceso a la red que utiliza. Esta informacin la enva al servidor a travs de un formulario insertado en una pgina Web. Anlisis del comportamiento de navegacin del usuario. Analizando los logs del servidor se obtiene informacin sobre las preferencias del usuario.

[MA00] es un trabajo muy amplio y completo en el campo de la entrega de contenidos adaptados. En el mismo se considera casi todas las caractersticas mencionadas y a tener en cuenta a la hora de una adaptacin. En concreto, las preferencias del usuario, las caractersticas del dispositivo y el estado de la red. Sin embargo, no hay una clara referencia al hecho de que considere el estado de carga del servidor que en nuestra propuesta, es una clave fundamental a la hora de implementar una adaptacin dinmica (como se ver ms adelante). De todas formas, este trabajo mereca ser expuesto en detalle por las caractersticas generales que plantean en su marco de trabajo.

3.1.2 Microsoft Research China


Este es otro grupo a tener en cuenta en el campo de la entrega de contenidos adaptativos en entornos heterogneos de red. Al igual que [MA00], pone especial nfasis en el hecho del acceso a los sus contenidos desde cualquier lugar, cualquier momento, y con cualquier dispositivo (anywhere, anytime with any devices) [YAN00] [CHE00]. Nuevamente el concepto de Entrega de Contenidos Adaptados -Adaptive Content Delivery es el que se alude en este trabajo, definindolo como la tecnologa que entrega contenidos dinmicamente teniendo en cuenta los cambios del entorno de trabajo que se producen.
Pagina 22

Contenidos voluminosos de informacin son clasificados a fin de adaptarse a las preferencias de los usuarios y condensados para mostrarse mejor sobre pequeos dispositivos con conexiones lentas. [YAN00] enfoca su trabajo sobre dos reas: 1. Nuevos algoritmos para extraer los contenidos estructurales de las pginas web, y 2. Tecnologas de sistemas para construir servicios de entrega de contenidos adaptativos. La arquitectura del sistema planteado se muestra en la Figura 78 y podemos observar los siguientes mdulos: Discovery&Profile Database. Agente auto-mejorado (self-improved agent) que recoge y mantiene informacin de los clientes, el sistema y la red. Content Adaptation. Formado por los filtros para convertir, resumir y sustituir contenidos. Layout & Format. Organiza y genera los contenidos finales para ser entregados. Cache Manager. Almacena frecuentemente los resultados de la adaptacin utilizada para el rendimiento del proceso.

Figura 7 Arquitectura del Sistema

Se observa en el sistema un mdulo denominado Content Parser que es el encargado de recabar la informacin estructural de las pginas HTML. Para ello utiliza un algoritmo de anlisis a fin de extraer los contenidos y sus propiedades de apariencia y posteriormente intenta generar grupos de objetos. El Decision Engine (Motor de Decisin) decide que contenidos, con que apariencia y en que forma sern enviados al usuario final. Es este ultimo el que, a su vez, colecta informacin del usuario/dispositivo/red a partir de los otros mdulos.

Figura extractada de [YAN00]

Pagina 23

En [CHE00] este grupo presenta su AWCD Adaptive Web Cotent Delivery. Una propuesta para proveer un servicio Web personalizado y adaptativo para clientes. Con AWCD, el usuario web puede obtener el contenido ms apropiado a su dispositivo y a sus preferencias, al mismo tiempo que minimiza el consumo del ancho de banda. La arquitectura bsica de AWCD se muestra en la Figura 89 y est formada por dos subsistemas: Client Profile Learning. Analiza el entorno del cliente Adaptation. Ejecuta las decisiones de adaptacin y genera un nuevo contenido web.

El subsistema Client Profile Learning, basndose en una estructura tpica de Internet, realiza la siguiente separacin de las caractersticas a fin de describir la variacin del entorno del cliente: Las Caractersticas de la Red (Network Characteristics): ancho de banda de la red, retardo, tasa de error y tasa de congestin. Mdulo del Procesador (Processor Module): capacidades de hardware y tipo de software. Interfaz de Usuario (User Interface): dispositivos de entrada/salida y tipo de navegador. Preferencias del Usuario (User Preference): tiempo de espera aceptado, las preferencias de contenido, las preferencias de tipo de media, las preferencias de entrega, la presentacin , etc.

Figura 8 Estructura bsica del sistema AWCD

Figura extractada de [CHE00]

Pagina 24

3.2 Las caractersticas y preferencias del usuario


En este apartado se describen los estudios realizados en el campo de la adaptacin de contenidos teniendo en cuenta las caractersticas y/o preferencias del usuario. Los Adaptive Hipermedia System (AHS)10 construyen un modelo de los objetivos, preferencias y conocimientos de cada usuario y usa este modelo a travs de la interaccin con el usuario, a fin de adaptarse a sus necesidades. En [BRU01] se hace una resea de los distintos entornos donde pueden ser utilizados y potenciados. As, identifica 6 tipos planteados ya en 1996 [BRU96]: hipermedia educativa, sistemas de informacin on-line, sistemas de ayuda on-line, hipermedia para la recuperacin de la informacin, hipermedia institucional y sistemas para la administracin de vistas personalizadas en espacios de informacin.

A continuacin vamos a realizar una resea de algunos trabajos de investigacin desarrollados en este campo. Se describiren las tcnicas de adaptacin utilizadas y se resaltan las caractersticas de cada uno de ellos con el objetivo de tratar de encontrar los patrones comunes que los rigen.

3.2.1 De Bra y Brusilovksy


En las aplicaciones hipermedia adaptativas el sistema est al tanto de la evolucin de los aspectos del usuario, como son las preferencias y conocimiento del dominio. Este registro actualizado, permanente y continuo es denominado el modelo del usuario. El modelo del usuario es usado para guiarlo a travs de la nueva informacin interesante y liberarlo de la informacin que el sistema considera no apropiada o poco relevante [BRA99-1]. Los AHS podran hacer esto dinmicamente alterando la estructura de enlaces del hiperdocumento y/o generando o cambiando el contenido de los nodos de informacin. Por otra parte, como De Bra especifica, los AHS pueden tambin ser adaptables. Es decir, que el usuario puede configurar ciertas preferencias explcitamente o inicializar el modelo del usuario a travs de un formulario de registracin o pre-test. Por su parte, Brusilovsky [BRU96] distingue entre mtodos de alto nivel para el soporte de la hipermedia Adaptativa y tcnicas de bajo nivel que son utilizadas para implementar ese soporte. Un mtodo representa una nocin de adaptacin que puede ser representada a un nivel conceptual. Y una tcnica la forma de implementar un mtodo especifico.

10

Se utilizar la sigla en ingls AHS (Adaptive Hypermedia Sistem- Sistema Hipermedia Adaptativo) por estar muy generalizado su uso dentro de los ambientes de investigacin de los entornos hipermedia adaptativos.

Pagina 25

La adaptacin, segn [BRA99], puede ir desde una simple seleccin (automtica) entre diferentes versiones de algunas pginas de informacin, hasta una completa generacin dinmica de todas las pginas a partir de unidades atmicas de informacin y de todos los links de hipertexto. En [BRA99-1] hace una distincin entre las siguientes tcnicas de adaptacin: adaptacin de contenidos (content-adaptation) y adaptacin de enlaces (link-adaptation); que por otra parte, BRU96] las denomina como Presentacin Adaptativa (adaptive presentation) y Navegacin Adaptativa (adaptative navigation).

3.2.1.1

Adaptacin de Contenidos (Content-Adaptation)

Podra ser deseable presentar la informacin sobre ciertos temas en diferentes formas, dependiendo de los (pre)conocimientos, objetivos, preferencias u otras propiedades caractersticas del usuario. As, podran ser agregadas introducciones bsicas para los usuarios noveles o material avanzado para los expertos. Una explicacin podra existir en diferentes versiones, para usuarios con diferentes conocimientos. El orden, en el cual los tem son mostrados en una pgina, podra ser tambin diferentes para los diferentes usuarios. De Bra distingue, en el nivel de mtodos de adaptacin, tres mtodos: Explicaciones adicionales, de prerrequisitos y comparativas. Variaciones de explicacin Clasificacin (contenidos)

Brusilovsky [BRU96] menciona las siguientes tcnicas para adaptacin de contenidos: Texto condicional Expansin de texto (stretchtext) Variaciones de fragmentos Variaciones de pginas Tcnicas basadas en fragmentos.

3.2.1.2

Adaptacin de Enlaces (Link-Adaptation)

La idea bsica de una adaptacin de enlaces es cambiar o anotar la rica estructura de enlaces de forma que el usuario sea guiado hacia la informacin relevante y de inters, y liberarlo de la informacin sin importancia. La adaptacin de enlaces intenta simplificar la estructura de enlaces y as reducir los problemas de orientacin, manteniendo una gran libertad en la navegacin. Los mtodos de adaptacin definidos son: Gua a nivel global o local. La gua es ofrecida indicando que enlaces son preferidos sobre otros. Soporte de orientacin global o local. Depende del contexto que provee. Este requiere algn mapa (posiblemente textual) de la estructura de enlaces alrededor del nodo actual (pgina).
Pagina 26

Administracin de vistas personalizadas (sobre una estructura de enlaces).

.Las tcnicas consideradas para una adaptacin de enlaces son [BRU96] [BRA98]: Gua directa (por ejemplo, un botn Siguiente) Clasificacin de enlaces (como en los motores de bsqueda) Ocultacin de enlaces (oculta los enlaces no relevantes, pero mantiene el texto anclado) Anotacin de enlaces (por ejemplo, uso de colores para indicar la relevancia) Deshabilitar enlaces (inutilizar los enlaces no relevantes) Remocin de enlaces (remover los enlaces no relevantes) Adaptacin de mapas (proveer vistas personalizadas)

De hecho no existen AHS que soporten todos los mtodos y tcnicas descriptas anteriormente. El uso de todas las tcnicas de adaptacin en forma simultnea nos conducira a un sistema poco utilizable. Sin embargo, en los sistemas futuros el diseador debera ser capaz de seleccionar las tcnicas deseadas y obtener un sistema que soporte cada opcin. Brusilovsky [BRU01] muestra de manera muy explcita la taxonoma actualizada para las tecnologas hipermedia adaptativas como se muestra en la Figura 911, la cual es una interesante representacin de lo expuesto anteriormente.

3.2.1.3

AHAM (Adaptive Hypermedia Application Model): Modelo de Referencia para Hipermedia Adaptativa basado en el Modelo de Dexter

El modelo de Dexter ha sido ampliamente utilizado para la representacin de los sistemas hipertexto/hipermedia. Como seala [BRA99-1], el modelo describe una arquitectura mucho ms poderosa en algunas reas que cualquier sistema hipermedia actual. El modelo de Dexter, es sin duda el modelo de referencia ms usado, siendo an el ms apropiado para modelar la mayor parte de las aplicaciones hipermedia. [BRA99-1] presenta AHAM, un modelo de referencia para aplicaciones hipermedia adaptativas, que encierra la mayora de las caractersticas soportadas por los sistemas adaptativos que hoy existen o que estn siendo desarrollados. En AHAM se describen los AHS mediante el uso de una terminologa conocida y genrica. Para esto, intenta acomodar la hipermedia adaptativa dentro del modelo de Dexter a fin de caracterizar y comparar los diferentes AHS. Mediante esta formalizacin de los AHS como sistemas hipermedia basados en el modelo de Dexter, muestra tambin como relacionar las tcnicas adaptativas dentro de dicho modelo. Por otra parte, provee las bases para el desarrollo de los nuevos AHS. Para ello, realiza una clara distincin de algunos conceptos a menudo confundidos y mezclados. Estos son:

11

Figura extractada de [BRU01]

Pagina 27

Adaptive multimedia presentation Adaptive text presentation

Natural language adaptation

Inserting / removing fragments Altering fragments

Adaptive presentation

Adaptation of modality

Canned text adaptation

Stretchtext

Sorting fragments

Adaptive hipermedia technologies

Dimming fragments

Direct guidance

Adaptive link sorting

Hiding

Adaptive link hiding Adaptive navigation support

Disabling

Removal Adaptive link anotation Adaptive link generation Map adaptation

Figura 9 Taxonoma actualizada de las tecnologas hipermedia adaptativas.

El modelo del dominio (domain model). Describe como la informacin es estructurada y enlazada. Esto corresponde en lneas generales a la capa de storage del modelo original de Dexter. El modelo del usuario (user model). Describe cual es la informacin del usuario que el AHS conservar como registro permanente. Esto incluye la representacin del conocimiento que el usuario obtiene y un registro de los nodos visitados por el usuario. El modelo de aprendizaje (teaching model). Consiste en reglas pedaggicas que definen como el modelo del dominio y el modelo del usuario son combinados para proveer los caminos para ejecutar la adaptacin en curso. Se aclara en este punto que el trmino enseanza y pedaggico no implican que AHAM pudiera ser til solamente para AHS usados en aplicaciones educativas. Un motor adaptativo (adaptative engine). Ejecuta la adaptacin en curso adaptando o generando dinmicamente el contenido de los nodos y el destino y clase (class) de los enlaces a fin de guiar cada usuario individual de forma diferente.

Ahora bien, en las aplicaciones hipermedia el nfasis siempre est en el contenido de la informacin (nodos) y en la estructura de enlaces. El modelo de Dexter confirma esto concentrndose sobre lo que llama la capa storage.
Pagina 28

En los AHS la funcin principal del modelo del dominio est compartida con el modelo de usuario. Un modelo del usuario representa como los usuarios se relacionan con el modelo del dominio. El dominio de la aplicacin negocia con un cierto nmero de conceptos. El modelo del usuario est al tanto de cuanto conoce el usuario sobre cada uno de los conceptos del dominio de la aplicacin. A fin de ejecutar la adaptacin basada sobre el modelo del dominio y el modelo del usuario se especifica como los conocimientos del usuario tienen influencia sobre la forma en que la informacin, desde el modelo del dominio, es presentada. Esto se hace por medio del modelo de enseanza que est constituido de reglas pedaggicas. Las reglas son utilizadas por un motor adaptativo con el fin de generar lo que en el modelo de Dexter se denomina presentation specifications. La Figura 1012 muestra el modelo de AHAM como una extensin del modelo de Dexter. Al igual que en este ltimo, AHAM pone su atencin sobre la capa storage, anchoring y presentation specifications. En Dexter la nocin principal de la capa de storage es el componente. Esta nocin cubre tanto nodos como enlaces. En hipermedia adaptativa las nociones principales son los conceptos y la relacin de conceptos.

Figura 10 Modelo de AHAM

3.2.2 MAS-PLANG
MAS-PLANG (MultiAgent System PLANG13) es un sistema multiagente desarrollado para transformar el entorno educativo virtual de las USD (Unitats de Suport a la Docncia) en un AHS, teniendo en cuenta los estilos de aprendizaje del alumno [PE02], [PE02-1], [PE02-2].

12

Figura extractada de [BRA99-1]

Es un proyecto del grupo BCDS Broadband Communications and Distributed System de la Universitat de Girona para la "Implementacion y estudio de una plataforma telematica de nueva generacin para el soporte de enseanza abierta y a distancia (PLAN-G PLAtaforma de Nueva Generacin" )

13

Pagina 29

Este proyecto es otro ejemplo de la adaptacin de contenidos a partir de las caractersticas y/o preferencias del usuario. En este caso, las tcnicas de adaptacin estn dirigidas a la seleccin personalizada de los materiales didcticos, las herramientas de navegacin y las estrategias de navegacin del entorno educativo de acuerdo al estilo de aprendizaje del estudiante. Estamos hablando por consiguiente de adaptacin de contenidos y adaptacin de enlaces, al igual que se ha planteado en el apartado referido a De Bra y Brusilovsky. Con el fin de realizar el modelado del estudiante utilizan tcnicas de Inteligencia Artificial. El sistema tiene la capacidad de categorizar a los estudiantes de acuerdo a su habilidad de procesar, percibir, recibir, organizar y entender la informacin. El MAS-PLANG [PE02] modela al estudiante mediante la interaccin de sus agentes monitores, con los agentes del entorno del HabitatPro [HPR01], una herramienta diseada para la personalizacin de contenidos y sondeo de mercados utilizando tcnicas de Razonamiento Basado en Casos y Reglas de Lgica Difusa. Esta sistema se ha construido sobre una plataforma multiagente compatible con los estndares de FIPA [NOR00] utilizando lenguajes de programacin como el Java, JavaScript, Flash y XML. Ha sido diseado con el objetivo de ofrecer caractersticas de adaptatividad a la plataforma educativa USD [FAB00] utilizada para el soporte a la educacin a distancia a travs de la web, basndose en los estilos de aprendizaje,. Actualmente, la plataforma educativa USD, es un sistema adaptable que permite a los profesores crear y mantener unidades docentes navegables de forma secuencial o libre. Un conjunto de pginas HTML, que contienen material educativo utilizado para dar soporte a la enseanza, son agrupados formando una unidad docente. Por otra parte, permite al estudiante configurar su entorno de aprendizaje teniendo en cuenta sus preferencias en aspectos tales como tamao, forma y posicin de los conos, barras de navegacin, idioma del entorno, etc. La USD realiza una interesante separacin de lo que es estructura y contenido, permitiendo una reutilizacin de una misma pgina HTML en diferentes unidades docentes y la creacin de una sola estructura para el acceso a una misma unidad docente en diferentes idiomas. Esto se muestra claramente en la Figura 1114, en la que se representa un conjunto de pginas HTML, a travs de los nodos A-1 a C-2 y las estructuras de navegacin (e-1, e-2 y e-3). La figura muestra claramente, como al modificar la pgina representada por el nodo B-1, sta se modifica automticamente en todas las unidades docentes que la utilizan.

3.2.3 Sitios Web Adaptativos


Perkowitz y Etzioni [PER97] [PER98] [PER99] han venido desarrollando en el campo de los sitios web adaptativos interesantes propuestas a travs del uso de tcnicas de Inteligencia Artificial. Plantean la posibilidad de usar tcnica los logs de acceso de los usuarios, en los servidores web, a fin de mejorar automticamente el sitio web.

14

Figura extractada de [PE02

Pagina 30

Figura 11 Representacin de estructuras de navegacin y contenidos de aprendizaje en unidades docentes USD

Si bien es cierto, hacen uso de la interaccin con el usuario, plantean una solucin global y fuera de lnea (off-line) para la optimizacin y adecuacin del sitio web teniendo en cuenta el comportamiento del usuario. Por este motivo vamos a describir las conceptualizaciones realizadas por este grupo de investigacin. El problema de un buen diseo en un sitio web se debe a diversos factores: Acceden diferentes visitantes con distintos objetivos El mismo visitante podra buscar diferente informacin en diferentes momentos Muchos sitios web aumentan su diseo original acumulando enlaces y pginas en diversos lugares Un sitio podra estar diseado para un uso en particular, pero ser usado en la prctica de diferentes formas, por lo cual las expectativas del diseador podran ser violadas a priori.

Muy a menudo los diseos de sitios web son estructuras fosilizadas en HTML, mientras que la navegacin web es dinmica, dependiente del tiempo y de la idiosincrasia de los individuos. En [PER98] ya se plantea que los sitios web pueden ser adaptados bsicamente de dos maneras: Personalizacin (Customization). Adaptando la presentacin del sitio a las necesidades de los visitantes en forma individual, basndose en la informacin personal de cada uno de ellos. Optimizacin (Optimization). Mejorando la estructura del sitio basndose en la interaccin de todos los visitantes.

Basndose en esta clasificacin, proyectan su investigacin a partir de la optimizacin de un sitio web. La metodologa para la adaptacin del sitio web est motivada por cuatro objetivos fundamentales [PER98]: 1. Impedir el trabajo adicional a los visitantes (por ejemplo llenar cuestionarios). 2. Hacer el sitio web muy fcil de usar para todos.
Pagina 31

3. Usar los sitios web como estn. 4. Proteger el diseo original del sitio de cambios destructivos. Esto significa, aplicar solamente transformaciones no destructivas: es decir, cambios al sitio web que dejen la estructura existente intacta: agregar enlaces pero no removerlos, crear pginas pero no destruirlas, agregar nuevas estructuras pero no confundir las existentes. Posteriormente, a partir de los logs de acceso al servidor, el sitio decide cuando y donde ejecutar estas transformaciones. Page synthesis es la creacin automtica de pginas web. Perkowitz y Etzioni proponen la creacin de nuevas pginas ndices (index page), es decir, pginas que contienen enlaces a pginas de sitios referentes a un tpico en particular. Basndose en esto define el Problema de Sntesis de Pginas ndices (Index Pages Synthesis Problem) [PER98] de la siguiente manera: dado un sitio web y el log de acceso de los visitantes, crear nuevas pginas ndices que contengan las colecciones de enlaces a las pginas relacionadas pero actualmente no enlazadas. Ntese que, generalmente un sitio web est restringido a una coleccin de pginas HTML residentes en un servidor nico. Un log de acceso es un documento que contiene una entrada para cada peticin respondida por el servidor web. Cada peticin lista, al menos, el origen de la peticin (direccin IP), la URL peticionada y el instante en que realiz de la peticin. Las pginas relacionadas pero no enlazadas son pginas que comparten un tpico comn pero que no estn actualmente enlazadas con el sitio. Perkowitz y Etzioni presentan as, una nueva metodologa para el clustering (agrupamiento), denominada cluster mining, e introducen el PageGather, un algoritmo de sntesis de contenidos de pginas ndices. Dado un gran log de acceso, la tarea es encontrar una coleccin de pginas que tienda a ser concurrentemente visitada. El cluster mining es una variacin del clustering tradicional. As, en lugar de dividir el espacio total de los documentos, encuentran un nmero pequeo de clusters de alta calidad. Ms an, mientras que el clustering tradicional se ocupa de ubicar cada documento exactamente en un cluster, el cluster mining puede colocar un documento nico en mltiples y solapados clusters. El algoritmo PageGather usa el cluster mining para encontrar la coleccin de pginas relacionadas a un sitio web, basndose en la suposicin de la coherencia de las visitas realizadas al sitio. La metodologa propuesta por Perkowitz y Etzioni es interesante de tener en cuenta durante la optimizacin y adecuacin de los contenidos de los sitios web. Como se expuso, lo hace basndose en la interaccin con el usuario, haciendo uso de los logs de acceso que se generan en el servidor. Y, a partir de tcnicas de Inteligencia Artificial, plantea un algoritmo para la generacin de los nuevos ndices de pginas con una temtica determinada. Lo ms interesante de la propuesta es que, efectivamente no est modificando los contenidos tal y como han sido elaborados por sus autores. La optimizacin del rendimiento est apuntado a la navegacin general del sitio, sin tener en cuenta los aspectos individuales del usuario. En otros tipos de propuesta el sitio web es transformado dinmicamente, la informacin es personalizada para cada usuario basndose en un modelo de usuario y este modelo es estructurado sobre la base de la informacin recabada de las acciones previas del visitante. A diferencia de estos, la metodologa propuesta por Perkowitz y Etzioni realiza cambios (offline) del sitio entero visibles para todos los visitantes y no necesita peticiones o requerimientos de informacin de los visitantes en forma individual.

Pagina 32

3.2.4 Filtrado de Informacin Information Filtering


A continuacin vamos a comentar los trabajos de [MAR99] realizados en el campo del filtrado de informacin para la adaptacin de contenidos, teniendo en cuenta las caractersticas del usuario. Este sistema utiliza el Razonamiento Basado en Casos (RBC) como metodologa para la realizacin del filtrado de informacin y es capaz de seleccionar documentos HTML/texto, desde la web, atendiendo los intereses y las caractersticas del usuario. El sistema est basado en un componente de modelado del usuario. La arquitectura general des sistema se muestra en la Figura 1215, y est compuesta por los siguientes mdulos: El Modelo del usuario (User Model). Representa las caractersticas e informacin necesarias de un usuario particular; El Componente de modelacin del usuario (User Modeling Component). Es capaz de construir dinmicamente el modelo del usuario; El Recuperador externo (External Retriever). Interactua con AltaVista; El Componente de filtrado de informacin (Information Filtering Component). Selecciona los documentos relevantes para el usuario, de acuerdo a los contenidos del modelo de usuario; La Interfaz de usuario (User Interface). Administra la interaccin.

Figura 12 Arquitectura general del sistema.

El sistema durante la primera sesin del usuario intenta construir su modelo de usuario. Para esto, y a fin de construir dicho modelo de una forma fiable, utiliza cuestionarios para ser respondidos por el usuario, en los cuales expresa su grado de inters respecto a las

15

Figura extractada de [MAR99]

Pagina 33

categoras del dominio. Estas respuestas son utilizadas posteriormente para realizar el filtrado de la informacin. Vemos una vez ms, como a travs de las caractersticas y/o preferencias del usuario, esta vez explicitadas a travs de cuestionarios directos, se realiza una adecuacin de los contenidos a mostrar. En este caso, esta adecuacin se realiza a travs de un filtrado de la informacin y las metodologas para implementar este proceso se realiza a travs de tcnicas de RBC.

3.2.5 Agentes de Informacin Inteligentes - Algoritmos de aprendizaje


Los agentes de informacin inteligentes han sido de gran inters en los ltimos tiempos [BIL99] y, stos han apuntado a adaptar automticamente la informacin existente en la web considerando individualmente a los usuarios. [BIL99] concentra su trabajo en la aplicacin de algoritmos de aprendizaje para la adquisicin del modelo del usuario a partir de documentos de texto etiquetados. El modelado representa un punto vital en su trabajo. Tpicamente, los agentes inteligentes, para el acceso a la informacin, estn orientados a asistir al usuario en su bsqueda, a travs de informacin til e interesante. Para su construccin tiene en cuenta el conocimiento del usuario. Esto permite distinguir entre la informacin que un usuario encuentra interesante pero que ya conoce e la informacin que encuentra interesante y no conoce. Normalmente, los sistemas que adquieren los modelos del usuario desde documentos de texto requieren que el usuario explcitamente etiquete el texto como interesante o no interesante, o que asigne una valoracin basndose en algn tipo de escala. Ahora bien, [BIL99] plantea que si un agente de informacin inteligente puede ser un asistente personal que gradualmente aprenda sobre nuestros intereses y recupere la informacin interesante, entonces se podra pensar en tener ms de una forma de comunicarle nuestros intereses. Aplicar mquinas de algoritmos de aprendizaje para inferir los intereses de un usuario es una tarea difcil. Esto se debe a que, estos intereses no pueden considerarse estticos y no pueden modelarse con exactitud de una sola vez. Los algoritmos de aprendizaje deberan ajustarse rpidamente a los cambios de inters por parte usuario, an despus haber realizado un larago perodo de entrenamiento. En [BIL99], enfocan el problema de dos formas diferentes: En la primera, se induce un modelo hbrido que consiste de dos modelos separados de los intereses del usuario: uno a corto plazo y otro a largo plazo. El modelo a corto plazo se basa en informacin recientemente evaluada por el usuario. Esto permite una rpida adaptacin a los cambios de inters del usuario. El modelo a largo plazo, bsicamente, usa los datos recolectados sobre un largo perodo de tiempo. Este es usado para calcular las probabilidades de la relevancia de los documentos en casos donde el modelo a corto plazo no contenga informacin suficiente para clasificar el documento con precisin. En la segunda, el sistema posee la capacidad de construir explicaciones dentro del proceso de aprendizaje. Es decir, permite a los usuarios criticar las explicaciones dadas Por ejemplo, los usuarios pueden indicar si la misma lnea de razonamiento debera ser reutilizada para presentar o filtrar futuros documentos.

Pagina 34

3.2.6 Conclusiones del apartado


Hemos visto as, una serie de arquitecturas encontradas en el campo de la adaptacin de contenidos teniendo en cuenta las caractersticas y/o preferencias del usuario muy interesantes de considerar. En cada una de ellas se ha observado que implementan sus metodologas utilizando un gran espectro de herramientas o tcnicas. Estas van desde los simples cuestionarios, hasta las tcnicas de la Inteligencia Artificial, Agentes Inteligentes o Razonamiento Basado en Casos, siendo difcil poder precisar cual de ellas es la conveniente. Aparentemente, esta precisin ms bien depender de los objetivos perseguidos por el grupo de investigacin en cuestin. Sin embargo, la clasificacin realizada por [BRA99-1] es una clasificacin bastante flexible como para poder generalizar los distintos conceptos. Por otra parte, se pone en evidencia que en los distintos trabajos mencionados, ninguno concentra sus esfuerzos en considerar lo que ocurre con otras caractersticas que afectan directamente el comportamiento de los contenidos, como ser, los dispositivos de acceso, o el estado de la red o el servidor.

Pagina 35

3.3 El dispositivo de acceso del cliente


Las nuevas clases de dispositivos, denominados de forma convencional pervasive computing, son otro de los motivos que ha conducido hacia la adaptacin de contenidos. Dispositivos tales como PDAs (Personal Digital Assistans), HHC (hand-held computers- computadoras de mano), telfonos mviles, dispositivos de computacin para automviles y computadoras personales han permitido a los usuarios mayor posibilidad de desplazamiento y acceso a la informacin. La confianza por parte del usuario hacia este tipo de dispositivos es da a da ms notoria, motivo por el cual, las aplicaciones existentes tienen un creciente necesidad de posibilitarles el acceso a la informacin multimedia. Por Pervasive Computing denominamos a todo aquel dispositivo que nos brinde la posibilidad de manejar fcilmente la informacin. Dicho de otro manera, los dispositivos Pervasing Computing permiten a los usuarios realizar sus transacciones, personales o profesionales, usando una nueva clase de dispositivos inteligentes y portables. Estos nuevos dispositivos inteligentes cuentan con microprocesadores que permiten a los usuarios conectarse a la red y conseguir un acceso directo, simple y seguro para recabar informacin y servicios. As, estos dispositivos facilitan un acceso conveniente a la informacin almacenada, permitindoles funcionar desde cualquier lugar y en cualquier momento (anywhere - anytime). Todo esto, nos conduce al denominado Acceso Multimedia Universal, el cual tiene como idea bsica, posibilitar a los dispositivos de los clientes con capacidades limitadas (de comunicacin, procesamiento, almacenamiento y/o visualizacin) acceder a los contenidos multimedia. Un acceso multimedia universal puede ser provisto en dos formas bsicas: 1. Almacenando, administrando, seleccionando y entregando diferentes versiones de los objetos multimedia (imgenes, video, audio, grficos y texto) que conforman la presentacin multimedia. Esta manera a menudo es referenciada como info-pyramid. 2. Manipulando los objetos multimedia on-the-fly, es decir en tiempo real. Se podra realizar, por ejemplo, usando mtodos text-to-speech, trascodificacin de imagen y video, conversin de media y resmenes. Esto permite adaptar la entrega de contenidos multimedia a la gran diversidad de capacidades del dispositivo del cliente: comunicacin, procesamiento, almacenamiento y visualizacin. A continuacin, vamos a realizar una resea de distintos grupos de investigacin en el campo de la adaptacin de contenidos o acceso adecuado a la informacin teniendo en cuenta las caractersticas del dispositivo de acceso.

3.3.1 Proyecto UMA Universal Multimedia Access


El proyecto UMA [APER01][APER01-1] ha orientado su trabajo hacia temas relativos al acceso a los contenidos multimedia a travs de diversos esquemas, que tienen en cuenta las capacidades de los terminales y las condiciones de la red. Se han concentrado en el estudio de la distribucin de multimedia (comunicaciones, broadcasting, webcasting) haciendo uso de la nueva generacin de dispositivos mviles y sistemas de comunicacin inalmbricos. UMA intenta asegurar al usuario tener la misma confiabilidad e independencia en sistemas mviles que en entornos cableados. En sistemas desarrollados bajo UMA los contenidos multimedia necesitan primero ser analizados y luego convertidos para adecuarse a los diferentes requerimientos de las telecomunicaciones y/o tecnologas de acceso. El Anlisis es la parte del sistema que describe

Pagina 36

el contenido multimedia que usa MPEG-716. La Conversin de los objetos multimedia (Media Coversion) o trascodificacin es la parte que adapta el contenido a las diferentes capacidades del cliente. Esta conversin como dijimos, puede realizarse antes de la peticin del cliente o durante la peticin. El objetivo de UMA es proveer una interfaz perfectamente integrada entre el mundo cableado y el inalmbrico. Esto lo realiza de manera transparente para el cliente, considerando las capacidades de su dispositivo y mantenindolo conectado independientemente del punto de acceso; proveyndole de esta forma de la movilidad que necesita. Es decir, negocia la entrega de imgenes, video, audio y contenido multimedia bajo diferentes condiciones de red, preferencias de usuario y las capacidades del dispositivo de acceso. A pesar del hecho de tomar en cuenta cuestiones tales como las condiciones de la red y/o preferencias del usuario, la mayor motivacin de este proyecto se concentra en posibilitar a los terminales con capacidades limitadas (de comunicacin, procesamiento, almacenamiento y visualizacin) acceder a los contenidos multimedia disponibles. UMA presenta de esta manera, una solucin para que tanto los clientes cableados como los inalmbricos accedan a los mismos contenidos de un servidor, recibiendo cada uno el contenido adecuado a las capacidades del cliente. Actualmente dispone de un test-bed (banco de prueba) que ha sido desarrollado y es usado para el chequeo de los esquemas de descripcin (Description Schemes) del MPEG-7 y su acondicionamiento para sistemas de telecomunicaciones. Los se realizan considerando tres tipos de conexin: 56 Kbits/s, 2 Mbits/s y 10 Mbit/s; realizando la conversin de los objetos media a travs de la extraccin de cuadros (key frame extraction), trascodificacin y descripcin de contenidos usando el MPEG7 Media TranscodingHint Description Scheme. MPEG-7 propone un nmero de Description Schemes (DSs), especficos para la descripcin del contenido multimedia, diseados para manejar diferentes variaciones del material multimedia y describir los requerimientos de sus recursos. En la figura 1317 se muestra el testbed utilizado en el proyecto UMA.

Figura 13 Testbed utilizado en el proyecto UMA

16

el objetivo del estndar MPEG-7, formalmente denominado "Multimedia Content Description Interface", es proveer un basto conjunto de herramientas estandarizadas para describir los contenidos multimedia.
Figura extractada de [APER01-1]

17

Pagina 37

3.3.2 Proyecto MONADS


El proyecto MONADS [RAA99][RAA99-1][MIS99] realiza estudios sobre agentes de adaptacin para usuarios nmadas y es llevado adelante por el Nomadic Computing Group at the Computer Science Department at the University of Helsinki, Nokia Mobile Phones, Sonera, y Nokia Telecommunications. MONADS remarca la diferencia que existe entre los ambientes informticos para entornos mviles y los sistemas distribuidos tradicionales: ancho de banda, latencia, retardo o delay, tasa de errores, interferencia, calidad de visualizacin, etc.; aspectos que pueden cambiar drsticamente con el desplazamiento del usuario (nmada). Por ejemplo, al cambiar desde un entorno LAN a una conexin va telfono mvil. Esto ocasiona nuevas demandas para la adaptabilidad de los servicios de datos. Entindase aqu por adaptabilidad la forma en la cual los servicios se adaptan a las propiedades del dispositivo y a las caractersticas de la comunicacin establecida. La Tecnologa de Agentes es una de las soluciones de software que se considera como solucin para el acceso a datos en cualquier momento, desde cualquier lugar y de cualquier manera (anytime-anywhere-anyhow). En este sentido, el proyecto est basado sobre la idea de agentes adaptativos y colaborativos como se muestra en la Figura 1418. Cada tipo de agentes encapsula conocimiento sobre su dominio particular: los Agentes de Comunicacin de Datos (Data Communication Agent) entienden las propiedades de diferentes estructuras de comunicacin, tales como GSM Data, WLAN o GPRS. Los Agentes de Interfase de Usuario (User Interface Agent) conocen las capacidades del terminal, por ejemplo, su tipo de monitor. Y finalmente, los Agentes de Servicio (Service Agent) se ocupan de las restricciones que aplican a sus servicios, por ejemplo, el ancho de banda mnimo que necesita. Cada uno de estos agentes usa su conocimiento para una adaptacin tanto interna como colaborativa. As por ejemplo, no se enva video de alta resolucin en tiempo real sobre un enlace que no tiene suficiente ancho de banda. En su lugar, reduce el video y la razn de cuadros, para que la transferencia sea posible.

Figura 14 - Modelo de Adaptacin de Monads

El desafo fundamental en la computacin nmada es la adaptacin dinmica en la trada servicio-terminal-conectividad. La arquitectura de agentes inteligentes de MONADS y los

18

Figura extractada de [RAA99]

Pagina 38

servicios de dicho sistema es una posible solucin de los desafos impuestos en el problema de la nomadicidad [MIS99-1][MIS00][KOS00][CAM99][CAM00].

3.3.3 InfoPyramid
En [SMI99] se pone nuevamente de manifiesto la problemtica surgida a partir de la consideracin de los nuevos dispositivos de acceso utilizados en Internet. Esta creciente incompatibilidad entre las capacidades de acceso y proceso de la informacin de esta nueva clase de dispositivos - pervasive computing devices y los contenidos multimedia disponibles es el punto de concentracin de la propuesta realizada por este proyecto. La Figura 1519 muestra el sistema para la entrega de multimedia escalable para dispositivos pervasive computing propuesto en [SMI99].

Figura 15 Entrega de contenidos multimedia escalable para dispositivos pervasive computing

A fin de representar los objetos media que constituyen los documentos multimedia, utilizan el modelo de datos denominado InfoPyramid [SLI98], Figura 16. El InfoPyramid maneja las diferentes variaciones de los objetos media con diferentes modalidades y fidelidades. La escalabilidad de la entrega de multimedia se consigue a travs de: Almacenamiento, gestin, seleccin y entrega de diferentes versiones de los objetos media en la InfoPyramid, a fin de adaptar los documentos multimedia al dispositivo del cliente [MOH99] Manipulando los objetos media en tiempo real (on-the-fly), utilizando mtodos tales como trasformacin text-to-speech, trascodificacin de imagen, y generacin de resmenes [SMI98].

InfoPyramid provee un marco general de trabajo para gestionar y manipular los objetos media. Como se representa en la Figura 16, InfoPyramid maneja diferentes variaciones de los objetos media con diferentes modalidades (video, imagen, texto y audio) y diferentes fidelidades (resumidos, comprimidos, y variaciones escaladas). Tambin provee y gestiona los mtodos de trasformacin y resumen que generan las diferentes variaciones de los objetos. Cada objeto est representado por celdas en el InfoPyramid y la posicin sobre la columna correspondiente representa su grado de fidelidad. As por ejemplo, la celda inferior izquierda corresponde a video de alta resolucin. Las celdas que se encuentran por encima de esta

19

Las figuras 10 y 11 fueron extractadas de [SMI99]

Pagina 39

ltima, corresponden a alternativas de video de menor resolucin o comprimidas. Lo mismo ocurre con el resto de los objetos correspondientes a imagen, texto o audio.

Figura 16 Esquema de InfoPyramid

Finalmente, la entrega contenidos multimedia a dispositivos pervasive computing se realiza de dos maneras: Entrega adaptativa (adaptive delivery). El servidor de contenidos usa la InfoPyramid para administrar y seleccionar las diferentes variaciones de los objetos media. Cuando el dispositivo del cliente peticiona un documento multimedia, el servidor selecciona y entrega la variacin ms apropiada del objeto. La seleccin la realiza teniendo en cuenta las capacidades del cliente, como tamao de la pantalla, la resolucin de colores, el ancho de banda de la red, la capacidad de almacenamiento del cliente, etc. Trascodificacin multimedia. Se realiza una transformacin en tiempo real de los objetos media teniendo en cuenta las capacidades del dispositivo del cliente. A fin de conseguir la mejor adaptacin, han diseado un sistema de encaminamiento dinmico que realiza un balance entre demora y distorsin del camino de trascodificacin seleccionado.

3.3.4 Digestor
En [BIC99] se plantea tambin el problema de las pginas Web cuyo diseo solo ha tenido en cuenta su visualizacin sobre ordenadores de escritorio que cuentan con resoluciones de monitor de 640x480 o ms. Esta desconexin, entre diseo y disponibilidad del rea pantalla disponible sobre los dispositivos mviles, conduce a una presentacin de pginas web antiesttica, incmoda, poco navegables y en el peor de los casos completamente ilegibles. Digestor toma como punto central de su trabajo el problema de cmo mostrar pginas Web, que han sido diseadas para ordenadores de escritorio, sobre dispositivos de acceso con capacidades de visualizacin ms limitadas. Digestor es un sistema de software que automticamente reescribe los documentos Web para mostrarlos apropiadamente sobre dispositivos con pantallas pequeas, tales como PDAs y telfonos mviles, proveyndolos as de un acceso independiente a la red. Esta es otra muestra de los intentos de adaptacin de la entrega de contenidos teniendo en cuenta las capacidades del dispositivo del cliente. En general, como remarca [BIC99], hay 4 metodologas para la visualizacin de pginas WWW sobre dispositivos con pantallas pequeas: 1. Diseo especfico para el dispositivo (Device-specific authoring). Implica el diseo de un conjunto de pginas Web para un dispositivo de visualizacin particular. La filosofa bsica de esta metodologa es que el usuario de tales dispositivos solo podr acceder
Pagina 40

a un conjunto exclusivo de servicios, y las pginas de estos servicios son diseados particularmente para el tipo de pantalla de ese dispositivo. 2. Diseo para mltiples dispositivos (mltiple-device authoring). Un espectro de dispositivos especficos es identificado y mapeado desde un nico documento fuente a un conjunto de documentos dados, a fin de cubrir el espectro de dispositivos. Un ejemplo muy sencillo de este tipo de diseo son las hojas de estilo del HTML (CSS Cascading Style Sheets). En una CSS, una nica hoja de estilo define un conjunto de atributos de visualizacin para diferentes porciones de la estructura del documento. 3. Navegacin desde el lado del cliente (client-side navigation). El usuario tiene la capacidad de navegar interactivamente un nico documento web cambiando la seccin que est visualizando en un dado momento. Un ejemplo muy trivial de esto es el uso de las barras de desplazamiento sobre el rea de un documento. 4. Rediseo automtico (automatic re-authoring). Implica el desarrollo de software que pueda tomar un documento Web, las caractersticas de visualizacin del dispositivo y redisear el documento a travs de una serie de transformaciones para que pueda ser visualizado apropiadamente sobre el dispositivo. Este proceso puede ser ejecutado sobre el cliente, sobre el servidor o sobre un servidor proxy http intermedio. Hay muchas tcnicas de re-authoring las cuales pueden ser categorizadas en dos dimensiones: sintctica vs. semntica y transformacin vs. supresin. Las tcnicas sintcticas operan sobre la estructura de la pgina, mientras que las tcnicas semnticas se sustentan en la comprensin del documento. Las tcnicas de supresin bsicamente remueven alguna informacin, dejando todo lo otro sin tocar, mientras que las tcnicas de transformacin implican la modificacin de algunos aspectos de la presentacin de la pgina o de su contenido. En el diseo de Digestor existen dos elementos principales: una coleccin de tcnicas individuales de re-authoring, que transforman los documentos en diversas formas y un sistema automatizado de re-authoring que implementa una estrategia de diseo que selecciona la mejor combinacin de tcnicas para el par documento / tamao de pantalla.

3.3.5 Conclusiones del apartado


De esta forma, se ha visto como el problema emergido a partir de las caractersticas del dispositivo de acceso y la dificultad que ellos presentan frente a los tradicionales diseos de las pginas Web, es motivo de estudio de diversos grupos. Hemos descrito algunos de estos trabajos a fin de dar una muestra de las diversas lneas de investigacin en el tema. Hay que resaltar el hecho que la mayora est considerando las caractersticas presentadas por los nuevos dispositivos de tecnologa mvil. Como dijimos, la mayora de los actuales servidores de Internet an proveen el mismo contenidos a todos los clientes sin considerar las variaciones del entorno que ellos pueden sufrir. Es evidente que las soluciones encontradas son diversas y podramos seguir mencionando trabajos poniendo en evidencia, an ms, esta diversidad. As, mencionar a Spyglass Prism [SPY02] como otro ejemplo de plataforma para transformacin y entrega de contenidos que permite visualizar contenidos web sobre telefona mvil, PDAs y sistemas de televisin interactiva.

Pagina 41

3.4 Tipo de Acceso y Estado de la red


Hemos llegado ahora a uno de los puntos crticos de nuestras consideraciones: el tipo de acceso y estado de la red. Muchos son los trabajos que hemos encontrado referentes a la forma de identificar o evaluar estas dos caractersticas, pero en pocos se ha considerado claramente la manera de reutilizar dicha informacin a fin de poder realizar una entrega de contenidos web adaptado a sus valores. El tipo de acceso y el estado de la red, son dos conceptos que estn estrechamente vinculados en lo que a tecnologa se refiere y podramos decir a priori que ellos influirn, o al menos deberan influir, en gran medida en la calidad del formato del contenido a transferir. Se pone en evidencia que el tipo de dispositivo de acceso tiene una estrecha relacin con el tipo de conexin de la que puede disponer y que entre ellas presentarn una diferencia muy importante en lo que a velocidad de acceso se refiere. De la experiencia como usuarios, sabemos que de la relacin excelente dispositivo de acceso / excelente tipo de conexin no tenemos necesariamente como resultado una excelente disponibilidad de contenidos. Ms an, bajo ciertas condiciones supuestamente excelentes, ya sea por el tipo de dispositivo de acceso y por el tipo de conexin, muchas veces hemos experimentado la frustracin de no poder acceder al sitio web solicitado debido al estado de la red. Esto fundamenta de manera ms que suficiente el hecho de la necesidad de conocer el estado de la red en cualquier momento, a fin de tenerlo en cuenta a la hora de realizar alguna entrega de contenidos adaptados. La infraestructura global de Internet puede representarse como una compleja matriz de portadores y proveedores de telecomunicacin. Infraestructura, por cierto, muy difcil de analizar y diagnosticar excepto dentro de los lmites de un proveedor de Internet individual. Existen numerosos trabajos independientes en el rea de la medicin punto a punto (end-toend) en Internet, por lo general llevadas a cabo por el usuario final con un inters en verificar el rendimiento de su servicio (nos referimos a los proveedores de servicio de Internet o ISP Internet Service Providers ). Estas mediciones implican el envo de trfico de prueba activo a partir del servidor o host final hacia la red y registrando la demora hasta que el paquete regrese de su destino. Desafortunadamente, dichas mediciones de trfico implican un largo nmero de parmetros que son difciles o casi imposibles de modelar. A continuacin describiremos algunos trabajos de esta rea a fin de poder encontrar los puntos comunes o al menos la tendencia existente en este campo.

3.4.1 CAIDA
CAIDA [CAI02] - Cooperative Association for Internet Data Anlysis - del Supercomputer Center de la Universidad de California, San Diego, es un interesante referente en el rea de desarrollo de herramientas para el anlisis y mantenimiento robusto de la infraestructura de Internet. De las lneas de investigacin de CAIDA podemos mencionar dos: NGI (Next-Generation Internet). Centrado en el monitoreo, descripcin y prediccin del comportamiento del trfico de redes, a travs del desarrollo y explotacin de herramientas para una mejor ingeniera y operacin de redes. BW-EST (Bandwidth Estimation). Proyecto financiado por DOE (Department of Energy) como parte de su programa de Descubrimiento Cientfico a travs de Computacin Avanzada (Scientific Discovery through Advanced Computing SciDAC). En el mismo se aborda la problemtica relativa al estudio de las
Pagina 42

caractersticas hop-by-hop y end-to-end de las redes. Asimismo, investigan los mecanismos para la incorporacin de metodologas para la estimacin del ancho de banda desde aplicaciones u sistemas operativos, para que las aplicaciones rpidamente encuentren el throughput ms alto que el enlace puede proveer. En [CLA99] se realiza una interesante clasificacin sobre los tipos de mediciones para redes agrupndolas en: pasivas y activas. Las mediciones pasivas dependen totalmente de la presencia de un trfico apropiado sobre redes bajo estudio y tienen la significante ventaja de que pueden ser realizadas sin afectar el trfico transportado por la red en cuestin durante el perodo de la medicin. Mientras que, las mediciones activas directamente prueban las propiedades de la red generando el trfico necesario para realizar la medicin. Esto permite mtodos de anlisis mucho ms directos, pero tambin presentan el problema de que el trfico medido puede tener un impacto negativo sobre el rendimiento recibido por otros tipos de trfico. [CLA99-1] realiza un resumen interesante de algunas de las aplicaciones desarrolladas en CAIDA. As, clasifica las aplicaciones para recoleccin, anlisis y visualizacin de los datos de trfico de Internet en cuatro grupos: Topologa de red (network topology). Describe la infraestructura de enlaces de la red sobre una serie de capas de protocolos. Carga de trabajo (workload). Estas mediciones involucran la recoleccin de la informacin de trfico desde un punto dentro de la red, por ejemplo, los datos colectados por un router o switch o por un dispositivo independiente monitoreando pasivamente el trfico. Rendimiento (performance). Implica la introduccin de trfico dentro de la red a fin de monitorear el retardo entre terminales especficos de la red. Encaminamiento (routing). Incluye datos desde las tablas de encaminamiento el Border Gateway Protocol (BGP), las cuales reflejan el trnsito entre canales de proveedores de servicio en un momento dado.

Skitter, Mantra, CoralReef, iffinder, cflowd [CAI02] son algunas de las aplicaciones que podemos mencionar, desarrolladas dentro de CAIDA, que muestran la capacidad de recoleccin y anlisis de datos que poseen. Se observa as, por un lado la importancia de la necesidad de conocer este tipo de datos a fin de optimizar el rendimiento de las redes. Por otro lado, la necesidad de encontrar el punto de encuentro para la reutilizacin de estos datos a la hora realizar una adaptacin de la entrega de contenidos, que es nuestro principal objetivo. CAIDA, es sin duda un referente muy fuerte en el campo de la identificacin del estado de la red, que no debemos dejar de tener en cuenta en nuestro trabajo.

3.4.2 Estimaciones sobre redes Best-Effort


Maryni y Davoli en [MARY00], presentan un mecanismo para la estimacin del ancho de banda disponible entre dos terminales (end-points) en redes del tipo best-effort. Este trabajo, resulta interesante desde el punto de vista del tipo de propuesta aunque cae dentro de un marco terico bajo suposiciones muy controladas que de hecho no se presentan en redes reales. Pero, a pesar de este inconveniente, resulta muy interesante de considerar y evaluar su implementacin. Las aplicaciones multimedia [MARY00] distribuidas se caracterizan por una mezcla de flujos de trfico (video, voz y datos) con diferentes caractersticas y requerimientos de rendimiento. En este marco, un determinado nmero de servicios pueden requerir un mayor ancho de banda y estrictas restricciones de Calidad de Servicio (QoS Quality of Service),
Pagina 43

Estas condiciones en redes de alto rendimiento (por ejemplo, ATM, en las que la disponibilidad del ancho de banda y los mecanismos de control pueden garantizar el QoS) no constituyen un problema. Sin embargo, estas mismas condiciones constituyen un problema en redes con capacidad limitada o servicios del tipo best-effort. Ms an, considerando la amplia difusin del protocolo IP (Internet Protocol), basado sobre el servicio best-effort, encontramos que por lo general las aplicaciones multimedia dependen de un protocolo con casi ninguna garanta de QoS. Este trabajo se centra en la problemtica referida a la implementacin de una funcin de control de admisin a travs de la estimacin del ancho de banda disponible entre dos puntos de una red best-effort [DAV96]. Para ello, se utiliza la generacin de un flujo sncrono de paquetes de testeo (test packets) entre dos servidores de un canal genrico con ancho de banda determinada y midiendo la variacin del retardo (delay jitter) introducido por la red. Esta medida posteriormente es relacionada con la carga de la red. El tren de paquetes no est relacionado con un tipo particular de fuente de datos, slo se trata de un flujo sncrono con propsitos generales de testeo. En este marco de trabajo, si el canal est levemente cargado, es razonable esperar que el receptor vea un tren sincronizado de paquetes. Mientras que, con el aumento de la carga del canal, se observar una degradacin de tal sincrona. La carga del canal aumenta agregando, en dos momentos diferentes, una transferencia de ficheros a travs de FTP. As, a travs de una serie de consideraciones estadsticas, ver [MARY00], se encuentra una funcin representativa del estado de carga en la red, Figura 1720

Figura 17 Representacin del estado de la red bajo condiciones controladas del flujo de trnsito.

Algo a resaltar en este trabajo es la consideracin de la perspectiva del usuario sobre la Calidad de Servicio Percibido (PQoS Perceived Quality of Service). El PQoS representa el grado de calidad percibido por el termino medio de los usuarios. Mientras que el QoS est definido por restricciones analticas sobre cantidades objetivas tales como el delay o el jitter, el PQoS est dado por un conjunto de grados subjetivos definidos, por ejemplo, por etiquetas tales como muy bueno, bueno o suficiente. Para la estimacin del PQoS realizaron a un conjunto de estudiantes una serie de apreciaciones, para una aplicacin bajo diferentes condiciones de red que luego compararon con los resultados representados por

20

Figura extractada de [MARY00]

Pagina 44

la funcin de la figura anterior, encontrando esta funcin como una buena representacin de estas apreciaciones subjetivas. Finalmente, una de las posibilidades de uso de este esquema es utilizar la informacin del ancho de banda disponible para controlar la razn de transmisin de las fuentes de tiempo real (por ejemplo, video), diminuyendo esta proporcin cuando el umbral sea excedido. Otra aplicacin, es en el control de admisin. En este caso debera tenerse en cuenta que existe una cantidad de trfico de background incontrolable, que podra producir cambios significativos despus de que las decisin de admitir / rechazar sea tomada. Un marco de trabajo similar es planteado por Van Jacobson [JAC97] con el programa PATHCHAR. Sin embargo, los mecanismos de [JAC97] difieren de [MARY00] en dos aspectos fundamentales. [JAC97] est desarrollado sobre ICMP (Internet Control Message Protocol) y no sobre IP y trabaja sobre las bases de conexiones hop-by-hop y no sobre conexiones end-to-end como lo plantea [MARY00]. PATHCHAR surge como respuesta a los severos problemas de congestin existentes en Internet, permitiendo a cualquier usuario conocer el ancho de banda, delay, ndice de cola y prdidas de cada salto entre cualquier fuente / destino sobre la red. En [DOW99] podemos encontrar una interesante evaluacin del comportamiento de PATHCHAR sobre el anlisis de dos path (rutas) cuyas caractersticas de enlace son conocidas.

3.4.3 Conclusiones del apartado


Hemos realizado una resea de alguno de los trabajos de investigacin dedicados a la definicin del estado de la red. Sin embargo, stos ponen de manifiesto que el objetivo de sus trabajos estn centrados en el mejoramiento del rendimiento y la administracin de la red, como bien lo expone CAIDA. Lo importante ahora, sera encontrar como reutilizar esta tecnologa para que a partir de a sus resultados poder realizar una entrega de contenidos adaptativos. Los fundamentos de las tcnicas utilizadas son de nuestro inters, pues consideramos que implementaciones como las de Davoli o Van Jacobson, nos pueden conducir a algn mtodo que sea capaz de brindarnos la informacin que necesitamos y decidir que tcnica de adaptacin de contenidos podramos emplear.

Pagina 45

3.5 Estado de carga del servidor


Los actuales servidores http procesan las peticiones usando la poltica de cola first come first serve (primero que llega, primero que se entrega), lo cual implica que el servidor web procesa cada peticin en la medida en que sta llega. A mayor nmero de peticiones, mayor ser el nmero de respuestas del servidor, lo cual lo llevar incrementalmente a una degradacin del rendimiento de su servicio cuando estas peticiones superen las capacidades de procesamiento de dicho servidor o del ancho de banda disponible, produciendose as los indeseados cuellos de botella. En principio, estos servidores estn dimensionados de forma tal que pueden servir la totalidad de las peticiones. Sin embargo, en la prctica, se dan frecuentes casos en los que como usuario nos vemos ante la imposibilidad de realizar una conexin debido justamente a la sobrecarga que el servidor presenta en ese momento. Esto ha conducido a diversos grupos de investigacin a plantear soluciones en este campo, con el fin de optimizar el rendimiento de entrega de contenidos de los servidores en la web. El problema ha sido atacado desde diferentes puntos de vista, pasando por tcnicas como la de caching, distribucin de contenidos en servidores cooperativos, prefetching, utilizacin de proxies, etc. Cualquiera de las tcnicas apunta fundamentalmente a solucionar por un lado el problema de sobrecarga del servidor, y por otro lado permitir una mejora en el servicio de entrega de contenidos al usuario. A continuacin, haremos una resea de alguno de los grupos de trabajo este campo, a fin de conocer algunas de las propuestas planteadas y que esto sirva como un punto de partida en nuestras implementaciones.

3.5.1 Adaptacin de los Contenidos Web Web Content Adaptation


En [ABD99] se plantea la adaptacin de contenidos web como una solucin para mejorar el rendimiento de la carga del servidor y es un trabajo que ha resultado de inters a nuestra lnea de investigacin. Propone resolver el problema de la sobrecarga adaptando, los contenidos entregados a las condiciones de carga del servidor. Tiene como premisa que una entrega exitosa de un contenido que requiera de menos recurso bajo sobrecarga es, desde el punto de vista del cliente, ms til que el rechazo de la conexin por parte del servidor [ABD99] sugiere la viabilidad de la adaptacin de contenidos desde tres puntos de vista diferentes: 1. Aptitud para la automatizacin de la adaptacin de contenidos con una mnima intervencin del proveedor de contenidos. 2. Adaptacin del contenido web, preservando la informacin adecuada a fin de conseguir ahorros de los requerimientos de recursos. 3. factibilidad de la aplicacin de tecnologas de adaptacin de contenidos sobre la web sin modificaciones sobre los servidores web existentes, navegadores o el protocolo HTTP. Asume que los motivos que pueden producir la sobrecarga de un servidor se deben bsicamente a la saturacin de procesamiento de la CPU o la saturacin de la capacidad del enlace de conexin del servidor a la red. Propone la adaptacin de contenidos como una
Pagina 46

tcnica para solucionar estos problemas. Esta tcnica, a diferencia de otras (carga distribuida de servidores, redireccionamiento, etc.) que proponen soluciones basadas en el balanceo de la carga entre mltiples servidores, permite que los servidores se preocupen por si mismos del problema del manejo de la sobrecarga. Las tcnicas tenidas en cuenta para realizar tal adaptacin son: Degradacin de la imagen por compresin (Image degradation by lossy compresin). Las imgenes GIF y JPG constituyen un amplio porcentaje del total de bytes de un sitio. En la mayora de los casos, estas imgenes pueden ser significativamente comprimidas, sin que ello signifique una disminucin apreciable en calidad sobre la mayora de los monitores de los clientes, lo cual demuestra un potencial para conservar recursos mediante la degradacin de la calidad de la imagen. Reduccin de los objetos incrustados en las pginas (Reduction of embedded objects per page). Desde la perspectiva del servidor, el tamao del documento no es tan importante como el nmero de objetos incrustados en la pgina. Durante la recuperacin de una URL la aplicacin del cliente enva peticiones independientes para traer sus objetos incrustados [FIE97]. Reduccin de los enlaces locales (Reduction in local links). Otra forma de adaptacin de contenido es reducir los enlaces locales. Esta reduccin afectar el comportamiento de navegacin del usuario de manera tal que tiende a disminuir la carga sobre el servidor.

As, bajo este marco de trabajo, Abdelzaher y Bhatti [ABD99-1] introducen una arquitectura para la provisin de calidad de servicio (QoS) en servidores web a fin de realizar la diferenciacin entre clases de clientes. Esta arquitectura, planteada como una propuesta para la realizacin de control de admisin, se realiza justamente a travs de las tcnicas de adaptacin de contenidos antes mencionada. La capacidad de los actuales servidores de hospedar mltiples sitios los conduce ante un doble problema. Por un lado, el potencial conflicto de intereses y recursos sobre el servidor denominado performance isolation (aislamiento del rendimiento) y por otro lado a la necesidad de dar un tratamiento preferencial a los clientes ms importantes denominado service differentiation (diferenciacin de servicios). [ABD99-1] propone una adaptacin de contenidos como una nueva metodologa para controlar los recursos del servidor, impedir la sobrecarga y ejecutar el mencionado ailamiento del rendimiento y la diferenciacin de servicios. Trabajos como [IYE97] o [LI00] son otras propuestas de control de admisin sobre servidores que al igual que [ABD99-1] apuntan a mejorar el rendimiento del servidor En [ABD99-1] se asume que los contenidos estn pre-procesados y almacenados en mltiples copias que difieren en calidad y magnitud. Para la implementacin, interponen una capa de software entre los procesos del servidor y el subsistema de comunicacin, de manera tal que, esta capa tiene acceso a las peticiones http recibidas por el servidor y a las respuestas enviadas por ste a los clientes. Esta capa de software intercepta cada peticin y la redirige a la copia adecuada de contenidos. Para esto, la capa de adaptacin de contenidos debe medir el grado actual de utilizacin del servidor y decidir el alcance de la adaptacin que impedir la sobrecarga del servidor. Un importante punto a destacar en este proceso, es que adems el sistema tiene la capacidad de compartir la capacidad no utilizada. Es decir, ante la co-existencia de mltiples sitios, mientras que cada uno adapta sus contenidos bajo condiciones de carga a fin de permanecer dentro de sus asignaciones de capacidad, el exceso de capacidad que no es utilizado, puede ser puesto disponible para el resto de los sitios existentes.
Pagina 47

Esta arquitectura, para una administracin del QoS sustentada a travs de una adaptacin de contenidos, se diferencia de los actuales servidores no adaptativos o de aquellos que implementan un control de adaptacin binaria, en la capacidad de permitir a los servidores proveer una suave degradacin de los contenidos acorde a la carga que stos presentan. Ahora bien, una ltima observacin, realizada oportunamente por [ABD99-1], es que la metodologa de un almacenamiento mltiple de copias del sitio web es posible para sitios web estndares, pues en el caso de servidores de video, por ejemplo, sto tendra costos muy elevados posiblemente por la capacidad de disco necesitada.

3.5.2 Web Caching


Web Caching, [ROD99] [ROD01], es una estrategia utilizadas para mejorar el tiempo de respuesta a los usuarios y disminuir el uso del ancho de banda disponible, mejorando directamente el rendimiento del servidor. Un Web Cache (Servidor Web de Cache) mantiene copias de los objetos recuperados a travs de l, de manera tal que ante una futura peticin, no ser necesario volver a conectarse al recurso, sino tomarla directamente desde donde dicho objeto fue almacenado. En general, el throughput de una conexin sobre Internet est relacionado con el nmero de saltos que debe realizar a lo largo de su camino. Por lo tanto, la conexin ser ms lenta al encontrarse con mayor cantidad de saltos. La ubicacin de un Web Cache cerca de los clientes, implicar un mayor throughput para las peticiones servidas (hits) desde este cache. El Web Caching es fcil de implementar sobre HTTP, por la capacidad que tiene el protocolo de soportar las peticiones de un proxy. Un proxy es una aplicacin que escucha las peticiones desde los clientes y las redirige a un servidor y viceversa. Esto provee el entorno ideal para implementar caching, ya que en ese trabajo de transmitir las peticiones y respuestas entre clientes y servidores, podra tambin salvar copias de los objetos que pasan a travs de l. Debe resaltarse que, no todos los objetos pueden ser salvados por el cache. Generalmente los resultados de queries (consultas), o las URL que contienen cgi-bin no pueden ser salvadas. Como desventajas a resaltar del caching podramos mencionar por un lado el hecho que el servidor no puede mantener un log de las cuentas de acceso. Esto nos impedira llevar adelante la implementacin de alguna tcnica de evaluacin de los usuarios a partir de sus accesos. Por otro lado, el uso de un cache tiene el problema del mantenimiento de su consistencia, es decir, asegurar al usuario que la versin que est visualizando sea la ms reciente y no una versin almacenada anteriormente. En [KAR99] presentan consistent hashing, una estrategia que elimina la comunicacin intercache (la consulta simultnea entre Webs cache), permitiendo a los clientes decidir cul es el cache que tiene el dato requerido. El sistema ha sido denominado Cache Resolver. En un esquema jerrquico de consulta entre servidores de Web Cache, estos servidores se consultan a fin de encontrar el dato peticionado. En el hashing, en lugar de contactar con un cache primario para localizar el dato deseado en otros caches, el navegador directamente contacta un nico cache que tiene el recurso solicitado. Los navegadores realizan esta decisin con la ayuda de una funcin de hash que mapea los recursos (o URLs) a un conjunto que cambia dinmicamente los caches disponibles. Este sistema est basado sobre los conceptos de consistent hashing desarrollados en [KAR97]. Por ltimo, como lo manifiesta [KAR99], el hashing ofrece diversas ventajas sobre los tradicionales broadcast o los esquemas basados en directorios (directory schemes). En un multicast se debe esperar por la respuesta de todos los otros caches; mientras que en un unicast una mquina, localmente, puede calcular exactamente que cache puede contener
Pagina 48

un determinado objeto o determinar que no est cacheado, disminuyendo el uso de la red. En [KAR99] puede consultarse la manera en que este sistema fue implementado y una comparacin con otras posibilidades.

3.5.3 Prefetching
prefetching es la tcnica basada en la bsqueda anticipada de objetos probables a ser solicitados. en [DAVI99] se muestra uno de los trabajos realizados a travs de esta tcnica, con el objetivo de reducir el uso de la red y de la carga del servidor y mejorar de esta forma el tiempo de respuesta experimentado por los usuarios. Tiene como foco principal de atencin aplicar mecanismos de aprendizaje al problema de prediccin de navegacin en la web. En concreto, predecir la prxima pgina a ser visitada por el usuario. Con la premisa de tener fabricado un modelo de usuario, el sistema usando este modelo, puede anticipar la pgina a recuperar e ir a buscarla antes de que sea pedida y tenerla en cache. De manera que el usuario experimenta bajos retardos cuando intente recuperarla. El sistema planteado por [DAVI99] incluye una variedad de fuentes de informacin para la prediccin. Estas fuentes pueden incluir: Un historial individual del cliente. Sirve de gua del comportamiento del usuario. Patrones comunitarios de uso. Con la finalidad que dichos patrones promedios de comportamiento, puedan servir como puntos de apoyo cuando se carece de informacin individual. Utilizacin del contexto cuando los historiales no son relevantes. Para esto, analizan los contenidos textuales de las pginas recientemente recuperadas y los enlaces a las pginas a las que conducen a fin de que sirvan de guas de referencia para detectar los intereses del usuario. Los contenidos de otras aplicaciones relacionadas (news, email) que tambin presentan URLs que pueden ser seleccionadas como pginas a recuperar.

Es a travs de la combinacin de estas diferentes fuentes de informacin, que [DAVI99] realiza las predicciones de las acciones y consegue reflejar el inters del usuario.

3.5.4 Caching y Prefetching


Caching y Prefetching son tcnicas comnmente usadas en los sistemas de I/O para reducir el tiempo de recuperacin de los datos o latency. Cabe resaltar el trabajo realizado por [KRO97], en el que se evala el rendimiento de ambas tcnicas, haciendo uso de las trazas registradas en los logs de un servidor Web Proxy. En el trabajo de [KRO97] se seala que un caching, sobre un proxy local, puede reducir el latency al menos en un 26%, mientras que con un prefetching podra reducirse hasta un 57%. Por otra parte la combinacin de ambos puede proveer un mejoramientos del 60% de esta reduccin. [KRO97] concluye que para un estudio de sobrecarga, el caching ofrece una asistencia moderada en la reduccin del latency. Mientras que con el prefetching puede ofrecerse ms del doble del mejoramiento conseguido con caching.

Pagina 49

Aunque los resultados de estas simulaciones fueron realizados bajo condiciones controladas del entorno, muestran la efectividad tanto del caching como del prefetching, enfatizando, de esta manera la necesidad, de mejorar estas tcnica.

3.5.5 Web Servers


Desde la ptica exclusiva de los servidores, podemos decir que los avances en el campo de las fibras pticas en las redes y el incremento del ancho de banda de las tecnologas, tales como el cable modem o DSL, ser el servidor y no la red, el que probablemente nos conduzca a los indeseados cuellos de botellas. Las tradicionales tcnicas para el diseo de servidores web distribuidos recaen sobre la manipulacin de los recursos principales, tales como routers o servicios de DNS, que son los encargados de distribuir las peticiones a los mltiples servidores web. En [BAK99] se presenta el sistema DCWS Distributed Cooperative Web Server Servidor Web Cooperativo Distribuido, cuyo objetivo es explorar las tcnicas del nivel de aplicacin para distribucin de contenidos web. DCWS est basado en la manipulacin dinmica de los hyperlinks incrustados en los documentos web a fin de distribuir las peticiones de acceso entre mltiples servidores web cooperativos. Considera una coleccin de documentos web como representada por un grfico orientado, donde cada documento es un nodo y cada hyperlink (o referencia a una imagen) es un enlace dirigido desde un nodo a otro. [BAK99] expone que de existir una forma de distribuir este grfico entre los servidores, de manera tal que la carga este uniformemente distribuida, entonces el problema del balanceo de carga ha sido resuelto. En este trabajo se adopta la metodologa basada en el grfico orientado y se sustenta en la hiptesis de que la mayora de los sitios web solamente tienen unos cuantos puntos de acceso perfectamente conocidos, desde los cuales los usuarios comienzan a navegar hacia los documentos de los otros sitios. Estos puntos de acceso conocidos, son mantenidos por los home servers donde el documento web se origina, mientras que los documentos internos menos conocidos estn migrados a servidores alternativos denominados co-op servers con el fin de balancear la carga. Los home servers y co-op servers conformarn el denominado DCWS. Los experimentos de [BAK99] muestran que este sistema tiene un alto potencial para conseguir una buena escalabilidad, impidiendo efectivamente los cuellos de botella de los recursos centralizados, tales como discos y anchos de banda de red. Por estos motivos ha sido interesante de analizar y tener en cuenta en nuestras investigaciones.

3.5.6 Conclusiones del apartado


Hemos expuesto, de esta manera, algunas de las lneas de investigacin relativas a la optimizacin de los recursos del servidor. Las soluciones, est claro, que son diversas e interesantes de considerar. Un adecuado equilibrio de dichas tcnicas en una solucin global e integradora sera interesante de conseguir. Probablemente la solucin final, recaiga sobre alguna de ellas en particular, pero el apartado ha tenido como objetivo fundamental exponer brevemente las distintas tendencias y aplicaciones. Particularmente, en los trabajos de [ABD99], encontramos una respuesta muy interesante a tener en cuenta, ya que trabaja sobre tcnicas exclusivas de adaptacin y modificacin de contenidos. Esto por otra parte, tiene la contrapartida de la sobrecarga de procesos que el servidor debe realizar. Una solucin de compromiso en la que podra plantearse la posibilidad de trasladar dichos procesos de datos a otros servidores. En ese sentido las
Pagina 50

tcnicas de caching o prefetching poseen un punto interesante a tener en cuenta, ya que estn basadas en algoritmos de aprendizaje, para la modelacin del comportamiento, algoritmos que, a priori, no inciden de manera importante en dichos procesamientos. Queda para futuros trabajos, realizar el balance de ventajas y desventajas de cada una de estas tcnicas para poder realizar una decisin acertada en la implementacin de nuestro sistema.

Pagina 51

4 - SHAAD: Sistema Hipermedia Adaptable, Adaptativo y Dinmico


Hemos realizado as, una resea de algunas de las lneas de investigacin en el rea de la adaptacin de contenidos. Queda claro, por un lado, que stos son algunos de los grupos avocados a esta tarea y son los que hemos considerado y/o analizado con perspectivas interesantes a tener en cuenta a la hora de realizar las implementaciones sobre nuestro sistema. Por otra parte, existen muchos otros grupos, con diferentes soluciones y planteamientos, que sin duda deberemos analizar y considerar. En la Tabla 1, hemos realizado una resea de las grupos vistos, bajo la denominacin que se les ha dado a lo largo del documento, a fin de mostrar su rea de influencia. Los grupos de investigacin han sido organizados teniendo en cuenta las caractersticas adoptadas como foco principal de los objetivos de sus investigaciones. Recordemos que tales caractersticas, segn habamos definido, son: Caractersticas y/o preferencias del usuario CPU. Tipo de dispositivo de acceso TDA. Tipo de acceso y estado de la red TA / ER. Estado de carga del servidor ECS.

A travs de la Tabla 1 se observa por un lado, que en ninguno de los sistemas descritos estn considerando todas estas caractersticas a la hora de realizar la adaptacin de contenidos. Los grupos de Hewlett Packar y Microsoft China, podramos resaltarlos como los ms completos en cuanto a sus consideraciones, sin embargo, vemos que no trabajan directamente sobre aspectos referentes a la carga del servidor. Por otra parte la denominacin utilizada para referirse al objetivo perseguido, vara segn el entorno de aplicacin, como ya lo habamos planteado en el apartado de Adaptatividad Adaptabilidad. En la tabla, bajo la columna Denominacin, hemos querido simplificar este concepto a travs de dichas denominaciones. Lo que se puede constatar, es que sea cual sea la terminologa empleada, la tarea apunta a una Adaptacin de Contenidos teniendo en cuenta alguna de las caractersticas planteadas con el objetivo de optimizar el rendimiento de los servicios sobre Internet. Ahora bien, bajo esta consigna nos planteamos preguntas tales como: es posible extender los conceptos tericos realizados por De Bra y Brusilovsky en el campo del modelado del usuario a los otros entornos? podemos utilizar los conceptos de Sistemas Hipermedia Adaptables, Adaptativos y Dinmicos en entornos que tienen en cuenta caractersticas tales como tipo de dispositivo o estado de carga del servidor? podemos implementar un sistema nico que considere todas las caractersticas planteadas y aunar la terminologa existente en los diversos campos? Como respuesta a todo esto, surge la propuesta de SHAAD Sistema Hipermedia Adaptable, Adaptativo y Dinmico, [MER02] [MER02-1], un sistema que atendiendo el estado de todas las caractersticas mencionadas y la variedad de contenidos web multimedia existentes, intenta adecuar dinmica o estticamente la informacin disponible y entregarla de la manera ms eficiente posible, con el fin de mejorar el rendimiento de la red.

Pagina 52

Grupo de Investigacin Hewlett Packard Laboratories Microsoft Research China De Bra Brusilovsky MAS-PLANG Sitios Web Adaptativos Information Filtering Algoritmos de Aprendizaje Proyecto UMA Proyecto MONADS InfoPyramid Digestor CAIDA Redes Best-Effort Web Content Adaptation Caching y Prefetching Web Servers

CPU X X X X X X X

TDA X X

TA /ER X X

ECS

Denominacin Entrega de Contenidos Adaptativos

AHS Adaptive Hipermedia System (Sistemas Hipermedias Adaptativos)

X X X X X X X X X
Tabla 1 rea de investigacin de los grupos descritos.

Acceso Multimedia Universal o Adaptive Delivety (Entrega Adaptativa)

Disponibilidad de Contenidos

Content Adaptation (Adaptacin de Contenidos)

SHAAD incluye los conceptos de Adaptabilidad, Adaptatividad y Dinamismo y lo hace de una manera muy particular. Considera al sistema como una anidacin de sub-sistemas, es decir, su comportamiento ser adaptable, adaptativo o dinmico dependiendo de la manera que en un momento dado se encuentre realizando las tareas de definicin de las caractersticas de entrada. En la figura 18, se presenta una estructura bsica de los componentes que actan en el sistema.

Caractersticas del Usuario? Tipo de Dispositivo? Tipo de Acceso, Estado de la Red? Estado de Carga del Contenido Adaptado

SHAAD

Figura 18 Componentes que actan en SHAAD.

Pagina 53

Recordemos, brevemente, los conceptos de [BRA99], expuestos en el Captulo 2: Hipermedias adaptables: sistemas en los que el usuario puede proveer algn perfil. Hipermedias adaptativos: sistemas que monitorizan el comportamiento de los usuarios y adaptan la presentacin teniendo en cuenta dicho comportamiento. Hipermedias dinmicos: El comportamiento de los usuarios tambin es monitorizado pero la adaptacin en lugar de ser cambiada seleccionando presentaciones predefinidas es reconstruida dinmicamente a partir de los objetos individuales que componen la pgina web.

Estos conceptos, como se expuso, hacen referencia al usuario y su comportamiento. Ahora bien, podemos extender esta visin y generalizar el concepto de usuario/comportamiento hacia otras caractersticas (dispositivo, estado de la red, etc.)?. En principio, esto es lo que se ha hecho en SHAAD, es decir, extender estas conceptualizaciones y pensar que un cambio de alguna de las caractersticas del usuario, tipo de dispositivo, estado de la red o carga del servidor pueden ser representados a travs de un cambio de su comportamiento. Por otra parte, al tratar de clasificar las metodologas o mecanismos para la definicin de cualquiera de estas caractersticas, podramos pensar en mtodos directos o indirectos, estticos o dinmicos y en la combinacin de ellos, caer dentro de un sistema que pueda tratarse como adaptable, adaptativo o dinmico. En la Tabla 2, representa de forma general, las distintas metodologas de definicin de las caractersticas y la solucin planteada para poder mejorar el rendimiento del sistema y su entrega de contenidos. Tratar de clasificar que tcnicas y/o soluciones son directas o indirectas, estticas o dinmicas?, puede llegar a ser motivo de un larga discusin, que cae fuera de los alcances de este trabajo de investigacin, pero que debern ser estudiados en algn momento. Pero si queda claro que, existen entre ellas diferencias marcadas en la forma y modo de implementarlas y que despus de analizarlas se podra llegar a algn acuerdo respecto a lo mencionado. Por todo esto podemos afirmar que nuestra clasificacin de adaptable, adaptativo y dinmico es vlida y aplicable.

4.1 Estructura de SHAAD


Vamos a ver a travs de las siguientes secciones, como se ha llegado al modelo general del SHAAD. La consigna fue plantear estructuras similares para un submodelo de SHAAD que, considerando cada una de las caractersticas para la adaptacin en forma individual, fuese capaz de representar el comportamiento del sistema para cada caso. Posteriormente por superposicin de estructuras llegar a una estructura general que represente el comportamiento del SHAAD. En cada submodelo, se describe brevemente alguno de los mdulos que posee, relacionados con la caracterstica que estn considerando (preferencias del usuario, tipo de dispositivo de acceso, tipo de acceso / estado de la red, estado de carga del servidor). Insistimos en la necesidad de tener en cuenta estas caractersticas, ya que sern los valores de entrada que repercutirn en el comportamiento y/o reaccin del sistema.

Pagina 54

Grupo de Investigacin Hewlett Packard Laboratories Microsoft Research China De Bra Brusilovsky MAS-PLANG Sitios Web Adaptativos Information Filtering Algoritmos de Aprendizaje Proyecto UMA Proyecto MONADS InfoPyramid Digestor CAIDA Redes Best-Effort Web Content Adaptation Caching Prefetching

Herramienta de definicin http, TCP/IP, cookies, Logs, Interfaz para el usuario, cuestionarios directos Aplicaciones para testeo

Solucin adoptada

Tcnicas para la transformacin de contenidos (Information Abstraction, Modality Transform, etc.) Analizador y reconstructor de contenidos (Parser) Cuestionarios para el usuario y Adaptacin de Contenidos y monitoreo del comportamiento Adaptacin de enlaces Cuestionarios para el usuario Adaptacin de Contenidos y Adaptacin de enlaces Anlisis de los logs del servidor Generacin de nuevos ndices para los enlaces Cuestionarios para el usuario Tcnicas de Razonamiento Basado en Casos para filtrar la informacin Valoracin de documentos y Filtrado inteligente de la tcnicas de IA para inferencias informacin automticas posteriores N/E (No Especificado) Banco Conversin de los objetos de prueba para experimentos multimedia (Testbed) Agentes Inteligentes Transformacin y transcodificacin de contenidos N/E Copia de contenidos (off-line), transformacin de contenidos (online) N/E Tcnicas de re-authoring Mediciones pasivas y activas N/E

Estimaciones sobre entornos N/E controlados Mediciones sobre el servidor Transformacin y transcodificacin de datos Anlisis de los logs del servidor Cache servers Modelado del usuario individual Prediccin y bsqueda anticipada y global de las pginas

Tabla 2 Herramientas para definicin y soluciones adoptados por los diferentes grupos reseados.

El modelo del SHAAD, Figura 19, est formado por 4 mdulos bsicos: Mecanismos para la definicin de las caractersticas para la adaptacin. Tienen como finalidad realizar la definicin de las caractersticas ya mencionadas: caractersticas y/o preferencias del usuario, tipo de dispositivo de acceso del cliente, tipo de acceso a la red, estado de la red y estado de carga del servidor. Mdulo de contenidos. Tiene como funcin entregar los contenidos peticionados, ya sea a travs de una generacin dinmica a partir de los elementos atmicos que constituyen la pgina web (generacin on-line) o la seleccin entre diferentes versiones estticas de esos contenidos previamente generados, (generacin off-line). Motor de decisin. Es el ncleo del sistema y el lugar en el que se evalan el estado de las caractersticas para la adaptacin, los contenidos disponibles. A partir de stos se infiere cuales son los mecanismos de adaptacin a aplicar para entregar el material de forma ptima al usuario. Este motor debe ser lo suficientemente inteligente para llegar a una solucin de compromiso adecuada, dado que est considerando todas las caractersticas para la adaptacin.
Pagina 55

Mecanismos de adaptacin. Teniendo disponible el nuevo sitio web generado por el mdulo de contenidos, puede implementar mecanismos alternativos de adaptacin. Por ejemplo, en el caso que debido al estado de carga del servidor no pudiera generarse dinmicamente una nueva pgina de contenidos. Esto implica que a pesar de no poder realizar la mencionada regeneracin, es an posible aplicar mecanismos alternativos a una pgina esttica (por ejemplo link adaptation)

Sistema Hipermedia Dinmico Sistema Hipermedia Adaptativo Sistema Hipermedia Adaptable

Mecanismos p/ la definicin de las CARACTERSTICAS PARA LA ADAPTACIN

MOTOR DE DECISIN

Mecanismos de adaptacin

Nuevo Contenido Adaptado al Usuario

Mdulo de Contenidos
VERSIONES ESTTICAS OFF-LINE

GENERACIN DINMICA A PARTIR DE ELEMENTOS ATMICOS ON-LINE

Figura 19 Modelo del SHAAD.

En el grfico anterior, se observa claramente la estructura anidada de los subsistemas hipermedias adaptable, adaptativo y dinmico de SHAAD y los mdulos de Mecanismos para la definicin de las Caractersticas para la Adaptacin y de Mecanismos de Adaptacin estn dentro de cualquiera de estos subsistemas. Esto tiene como finalidad indicar que la forma y modo de implementar estos mecanismos, darn al sistema las caracterizaciones de adaptabilidad, adaptatividad o dinamismo de tales subsistemas. En el modelo bsico de SHAAD, el Mdulo de Contenidos ha sido separado del Motor de Decisin. Su funcionamiento es una caracterstica interesante a tener en cuenta, ya que, en este mdulo hemos incluido un Analizador de Contenidos, cuyo funcionamiento se explicar ms adelante, que regenera dinmicamente la pgina a tratar, siempre y cuando la carga del servidor se lo permita. A nuestro entender es posible separarlo del Motor de Decisin, dado que ser este ltimo el que decida si dicho analizador puede dispararse o no, siempre que la carga del servidor se lo permita. Caso contrario, una copia off-line del contenido, previamente almacenado, ser seleccionado para la entrega. Tambin es interesante de verificar en el modelo, la existencia del Mdulo de Adaptacin, separado en este caso del Mdulo de Contenidos, ntimamente ligados pero separados. Con esto, se pretende representar que las tcnicas de adaptacin implementadas podrn ejecutarse, ya sea, dinmicamente sobre el analizador de contenidos, o sobre los contenidos estticos, mantenidos off-line, seleccionados desde las copias mantenidas del sitio web. De esta forma, queremos significar que an despus de seleccionar una copia disponible en el servidor con una determinada calidad, podremos aplicar alguna tcnica de adaptacin a fin de mejorar ms la entrega de los contenidos al usuario final (por ejemplo adaptacin de enlaces) y consecuentemente optimizar el rendimiento del servicio.

Pagina 56

4.1.1 Submodelo Estado de carga del servidor


Vamos a comenzar, planteando el submodelo de SHAAD que tiene en cuenta el estado de carga del servidor. Esto tiene el sentido que, en las sucesivas descripciones (otros submodelos y modelo final), se entienda el rol que tiene el Mdulo de Contenidos, expresamente separado del Motor de Decisin en el esquema general de SHAAD. El problema de sobrecarga del servidor ha sido considerado, en nuestra arquitectura, como una de las caractersticas relevantes, ya que ser sta la que dispare el Analizador de Contenidos cuando el Motor de Decisin as lo considere. Recordemos que en el Captulo 2, habamos descrito que el procesamiento de los contenidos hipermedia sobre el servidor pueden ser transformaciones on-line u off-line. Un proceso on-line o dinmico es aquel que genera dinmicamente el contenido de las pginas web a partir de los elementos atmicos que la conforman. En el proceso off-line o esttico se dispone de diferentes versiones del contenido hipermedia, en diferentes formatos y calidades, a fin de poder seleccionar alguna de esas versiones. El Mdulo de Contenidos interacciona directamente con el Motor de Decisin, al cual entrega la versin del contenido que surja de considerar el estado de carga del servidor. Si la carga sobre el servidor le permite inferir al Motor de Decisin, que el servidor tiene capacidad suficiente para realizar una transformacin on-line, pues ser en ese momento que decidir que tcnica de transformacin de contenidos puede realizar y lo que es ms importante, regenerar dinmicamente una pgina web a partir de sus elementos individuales. Esta tarea la har a travs del Analizador de Contenidos. Por otra parte, si el Motor de Decisin infiere que el servidor no tiene la capacidad suficiente para realizar esta tarea, pues en ese caso, seleccionar alguna de las versiones del sitio web, que se adecue a las otras caractersticas de adaptacin. A partir de all, ser nuevamente el Motor de Decisin el que determine, si a pesar de la carga del servidor, encuentra alguna tcnica de adaptacin apropiada, para mejorar la entrega del contenido esttico seleccionado desde el Mdulo de Contenidos. La Figura 20, muestra el submodelo de SHAAD para el caso del estado de carga del servidor. En este caso se ejemplifican dos mdulos:
Sistema Hipermedia Dinmico Sistema Hipermedia Adaptativo Sistema Hipermedia Adaptable
Mechanisms for the definition of THE STATE OF LOAD ON THE SERVER
HERRAMIENTAS DEL SERVIDOR WEB

MOTOR DE DECISIN

APLICACIONES DE TESTEO DEL SERVIDOR

Nuevo Contenido Adaptado

Mdulo de Contenidos
VERSIONES ESTTICAS OFF-LINE GENERACIN DINMICA A PARTIR DE ELEMENTOS ATMICOS ON-LINE

Contenido Hipermedia VERSIN 1

Contenido Hipermedia VERSIN 2

...

Contenido Hipermedia

Analizador de Contenidos ?

Nuevo Documento Hipermedia

Mecanismos de adaptacin

Figura 20 Submodelo para SHAAD considerando el acceso a la red

Pagina 57

Mecanismos para la definicin del estado de carga del servidor. Con las herramientas evaluadas: herramientas propias del servidor web (logs) y mediciones on-line sobre el servidor a travs del desarrollo de aplicaciones para tal fin. Mdulo de Contenidos. Se encarga de generar dinmicamente o de seleccionar a travs de versiones estticas el contenido adecuado. Tiene los siguientes bloques: 1. Generacin dinmica a partir de elementos atmicos. Genera dinmicamente la nueva pgina a partir de los elementos que componen la pgina original a travs del Analizador de Contenidos, esquematizado en la figura. 2. Versiones estticas hipermedia. En este bloque se encuentran disponibles versiones de las pginas web en diferentes calidades de formato y contenido.

4.1.2 Submodelo Caractersticas y preferencias del usuario


La Figura 21, hemos representado el submodelo para SHAAD que tiene en cuenta solamente las caractersticas y preferencias del usuario. En este submodelo se han utilizado como ejemplos las tcnicas y soluciones planteadas como soluciones, en los casos estudiados bajo esta ptica, en el captulo 2. En este submodelo, vamos a destacar dos mdulos: Mecanismos para la definicin de las caractersticas y preferencias del usuario. Se han incluido dos tcnicas para el modelado del usuario: 1. Cuestionarios de respuesta directa por parte del usuario a fin de obtener las caractersticas y preferencias del mismo. 2. Monitoreo del comportamiento del usuario para deducir las caractersticas del mismo a partir de su interaccin. Analizando la manera en que se accede o navega a travs del material disponible en el sitio Web el sistema intenta inferir los rasgos que definen al usuario. Con estos ejemplos se pretende mostrar como a travs de cualquiera de ellos, podemos caracterizar a nuestro sistema como adaptable o adaptativo, segn sea uno u otro el mecanismo que sea disparado.
Sistema Hipermedia Dinmico Sistema Hipermedia Adaptativo Sistema Hipermedia Adaptable
Mecanismos para la definicin de las CARACTERSTICAS Y PREFERENCIAS DEL USUARIO
CUESTIONARIOS

Mecanismos de adaptacin
MOTOR DE DECISIN
CONTENT ADAPTATION

Nuevo Contenido Adaptado

MONITOREO DEL COMPORTAMIENTO

LINK ADAPTATION

Mdulo de Contenidos

Figura 21 Submodelo para SHAAD considerando las caractersticas o preferencias del usuario

Pagina 58

Mecanismos de Adaptacin. De igual manera, en este mdulo hemos tomado como ejemplos las tcnicas para la adaptacin de contenidos mencionadas en el Captulo 2. Los mecanismos ejemplificados son: Adaptacin de Enlaces y Adaptacin de Contenidos.

4.1.3 Submodelo Acceso a la red: Dispositivo del cliente, Tipo de Acceso y Estado de la Red
Aunque estos tres conceptos son diferentes los consideramos juntos pues estn ntimamente relacionadas en lo que a tecnologa se refiere. De estas variables depender, en ltima instancia, la calidad del formato del contenido que se entrega al usuario. Como lo hemos manifestado, la gama de tipos de dispositivos de acceso a la red existentes es muy amplia y tienen una estrecha relacin con el tipo de conexin que disponen La figura 22, describe el submodelo de SHAAD, que representa el comportamiento del sistema teniendo en cuenta esta caracterstica, Es necesario describir particularmente dos mdulos del mismo: Mecanismos para la definicin de las caractersticas del dispositivo de acceso del cliente y el tipo de acceso / estado de la red. En este mdulo, al igual que antes, se han ejemplificado algunas de la tcnicas vistas con la misma finalidad. As, hemos incluido el protocolo http, las sugerencias de usuario, herramientas especficas para la determinacin del estado de la red,etc. Mecanismos de Adaptacin. Los ejemplos expuestos en el grfico: Algoritmos de Compresin, Algoritmos de Transformacin o Algoritmos de Clasificacin de datos, juegan en este submodelo un interesante rol a la hora de justificar el dinamismo del sistema. A modo de representar el comportamiento del sistema a travs de SHAAD, lo hemos situado en el mdulo de Mecanismo de Adaptacin, pero obsrvese que existe una estrecha vinculacin con el mdulo de contenidos, entendiendo que all podran tambin ejecutarse estas tcnicas de transformacin de datos.

Sistema Hipermedia Dinmico Sistema Hipermedia Adaptativo Sistema Hipermedia Adaptable


Mecanismos para la definicin de las CARACTERSTICAS DEL DISPOSITIVO DEL CLIENTE Y EL TIPO DE ACCESO / ESTADO DE LA RED SUGERENCIAS DEL USUARIO PROTOCOLO HTTP AGENTES INTELIGENTES
Algoritmos de Clasificacin de Datos

Mecanismos de adaptacin
Algoritmos de Compresin de Datos

MOTOR DE DECISIN

Algoritmos de Transformacin de Datos

Nuevo Contenido Adaptado

Mdulo de Contenidos

Figura 22 Submodelo para SHAAD considerando el acceso a la red

Pagina 59

4.1.4 Modelo del SHAAD


A travs de los submodelos propuestos anteriormente, hemos intentado inducir por medio de bloques homogneos la obtencin de un modelo nico. De esta forma, el modelo propuesto anteriormente en la Figura 19 y reproducido nuevamente en la Figura 23, representa al SHAAD. En esta se ha detallado ms el mdulo de Mecanismos para la definicin de las Caractersticas Para La Adaptacin. Establecimos como primera instancia, el hecho de considerar una generacin dinmica de contenidos (on-line) teniendo fundamentalmente en cuenta el estado de carga del servidor. Y se ha resaltado que a pesar de esta decisin, no hemos perdido de vista, que esta solucin no puede ser exclusiva y al final los procesos del Motor de Decisin tendrn que incluir soluciones mixtas en las que se consideren la combinacin de los estados de las caractersticas para la adaptacin definidas. Por otra parte, las tcnicas para la definicin de estas caractersticas como las herramientas para el anlisis y procesamientos de los contenidos web, son motivo de nuestro actual estudio. Debemos sealar que para la eleccin de estas tcnicas o herramientas, se estn teniendo en cuenta dos objetivos. Por un lado, tratar de utilizar los mecanismos ya establecidos en la conexin cliente-servidor y sacar el mximo rendimiento de esa situacin. Por ejemplo, las caractersticas del protocolo HTTP o el TCP/IP o las herramientas propias del servidor web o proxy (logs; identificadores de sesin, etc.), segn sea la configuracin adoptada. Por otra lado , desarrollar o utilizar aplicaciones externas solo si fuera necesario. No olvidemos que, el objetivo principal es mejorar el rendimiento de la entrega de contenidos y consiguientemente de los recursos de la red. Por lo cual, el equilibrio entre desarrollar lo necesario y reutilizar lo existente, cuello de botella de las decisiones, nos permitir, finalmente, obtener un sistema inteligente y equilibrado que no cargar la red con procesos externos innecesarios.
Sistema Hipermedia Dinmico Sistema Hipermedia Adaptativo Sistema Hipermedia Adaptable Mecanismos p/ la definicin de las VARIABLES DE ADAPTACIN
Caractersticas del Dispositivo del Cliente y el Tipo De Acceso / Estado de la Red

Caractersticas y Preferencias del Usuario

Estado de Carga del Servidor

MOTOR DE DECISIN

Mecanismos de adaptacin
Mdulo de Contenidos
VERSIONES ESTTICAS OFF-LINE

Nuevo Contenido Adaptado al Usuario

GENERACIN DINMICA A PARTIR DE ELEMENTOS ATMICOS ON-LINE

Figura 23 Modelo del SHAAD

Pagina 60

4.2 Implementaciones
A continuacin haremos una resea del Analizador de Contenidos que se est desarrollando en este momento y el anlisis realizado sobre el protocolo HTTP y sus posibilidades de brindarnos informacin.

4.2.1 Analizador de Contenidos


Como habamos dicho, El Analizador de Contenidos, por una parte, ser el encargado de analizar, desestructurar -separando los objetos que la conforman- y regenerar la pgina web solicitada, teniendo en cuenta estado de las caractersticas para la adaptacin que el Motor de Decisin considere importantes. Por otra parte, este analizador se disparar bajo la condicin que el estado de carga del servidor se lo permita, evaluacin que deber realizar nuevamente el Motor de Decisin. Esta herramienta ha sido desarrollada en diferentes fases de diseo, que se muestran en Figura 24 y se enuncian a continuacin.

Fase 1.- Transformacin del documento HTML a XHTML

Fase 4.- Obtencin del documento HTML adaptado

Documento HTML

JTidy

Documento XHTML

Procesador XSLT (XALAN) Documento HTML adaptado

Fase 3.- Obtencin del perfil de adaptacin a aplicar


Anlisis variables P0 P2 P1 P3 Perfil

Plantillas XSLT Sonido video Imgenes Atributos Etiquetas

Variables de entrada Dispositivo cliente Estado red

S HTM/ HTML?

Programa JSP

Usuario
No Entrega documento original

Fase 5.- Asignacin de valores

Fase 2.- Redireccin de las peticiones

Figura 24 Fases del diseo

4.2.1.1 Fase 1 Transformacin del documento HTML a XHTML


Inicialmente, el anlisis y regeneracin de contenidos iba a realizarse directamente sobre el documento HTML. Esto presentaba una serie de limitaciones (por ejemplo, etiquetas sin cerrar) que hacan que los documentos HTML, como tales, sean poco adecuados para realizar las transformaciones y adaptaciones. Ante estas restricciones, se analizaron otras posibilidades, pasando de esta forma a la consideracin del XML y posteriormente al XHTML.

Pagina 61

El XML permite especificar la estructura de un contenido, permitiendo de esta manera realizar un elevado nmero de operaciones de una manera eficaz. Analizando posteriormente que el XHTML es un documento HTML pero que sigue las reglas de buena formacin especificadas por XML y a la vez utilizan las herramientas que stos ltimos proporcionan, se decidi transformar directamente los documentos HTML en XHTML.

4.2.1.2 Fase 2 Redireccin de les peticiones


Este mdulo permite la redireccin de las peticiones de pginas Web que llegan al servidor, para que no sean enviadas directamente. De esta manera se realiza un filtrado de las peticiones y, si los documentos solicitados son HTML, se pasa al analizador para obtener un documento adaptado a las caractersticas definidas para la adaptacin.

4.2.1.3 Fase 3 Obtencin del perfil de adaptacin a aplicar


En esta fase es realiza un anlisis de los parmetros de entrada. El valor de estos parmetros debe ser especificados por el usuario a travs del simulador, caso contrario, se utilizan los valores asignados por defecto en el servidor. A partir de los parmetros de entrada se asigna un perfil de adaptacin. Este perfil de adaptacin es el que posteriormente se aplica al documento solicitado. Los perfiles definidos dependen de las siguientes variables consideradas: Respecto a las caractersticas del cliente: o o o o rea de la pantalla: resolucin Alta, Meidana (640x480), Chica (telfono mvill, PDA). Colores: Alta densidad, escala de grises. Software de video: s, no. Software de sonido: s, no.

En lo referente al estado de la red: grado de ocupacin del ancho de banda - libre, semi-ocupado, ocupado.

Para poder realizar el tratamiento de los elementos multimedia se dispone de diferentes versiones de un mismo elemento multimedia. Estas versiones son estticas, es decir, se tiene diferentes formatos del mismo elemento multimedia. Estas diferentes versiones estticas se encuentran dentro del mismo servidor, de manera tal que, cuando se aplica un perfil que implica un cambio de los elementos multimedia contenidos en un documento, se determina cual es el directorio de donde se obtendrn los elementos a enviar. Se han definido los siguientes perfiles, Tabla 3: Perfil 0: en este perfil solamente se tiene en cuenta el estado de la red. En el caso que el estado de sta sea muy malo, congestionado, se activar este perfil. Es independiente del valor de las caractersticas que definen al dispositivo de acceso del cliente. Documento a entregar: en este perfil se entrega un documento que contiene solamente texto, es decir, sin elementos multimedia (imgenes, video, sonido). En los lugares, donde deberan aparecer estos elementos multimedia, indica que all haba un objeto media. Perfil 1: este perfil se activa cuando las condiciones de la red y el clientes son muy buenas. En este caso el cliente dispone de todo el software necesario, de un
Pagina 62

dispositivo con monitor de alta resolucin con colores de alta densidad y al mismo tiempo el estado de la red sin congestin. Documento a entregar: con las condiciones dadas el documento solicitado se enva con todos los elementos (imagen, video, sonido) incorporados, tal y como estn en el documento original. Perfil 2: este perfil se activa cuando alguna o ambas variables (estado de la red y caractersticas del dispositivo del cliente) se encuentra en un estado que podemos calificar de medio. Como un estado medio hacemos referencia a tener un ancho de bando semi-ocupado, o que las caractersticas del dispositivo del cliente tiene una pantalla de 800x600, actuando independientemente de si tiene o no software de video. Documento a entregar: el documento se envia pero modificando los elementos multimedia. En este caso, la modificacin que se realiza, ser la de cambiar las imgenes por unas imgenes de menor calidad (calidad de color, medida de la imagen, etc.); no se envia el video, sino que ste ser substituido por un conjunto de 10 imgenes. Perfil 3: este perfil se activa cuando la calidad del dispositivo del cliente es baja y el estado de la red no es malo. La calidad del dispositivo del cliente se considera que es baja cuando el cliente dispone de un dispositivo con monitor de baja resolucin. Documento a entregar: el documento se envia pero modificando los elementos multimedia. En este caso, la modificacin que se realiza, ser la de cambiar las imgenes por unas imgenes de menor calidad (calidad de color, medidas de la imagen, etc.), menos que en el Perfil 2; no se envia el video sino que ste ser sustituido por un conjunto de 5 imgenes.

RED (Ancho de Banda) Ocupado Perfil 0 Alta DISPOSITIVO (Resolucin 4.2.1.3.1.1.1.1.1 Mediana Perfil 0 de Pantalla) Perfil 0 Pequea Semiocupado Perfil 2 Perfil 2 Perfil 3 Libre Perfil 1 Perfil 2 Perfil 3

Tabla 3 Valores de activacin de los perfiles

Pagina 63

Otro parmetro que se ha tenido en cuenta para la adaptacin es el Color. Este trabaja conjuntamente con los perfiles definidos. Los perfiles determinan que cdigo de condicin se ha de ejecutar de la plantilla XSLT correspondiente. En cambio, con el parmetro Color se indica si las imgenes y/o video que se han de enviar, sern en colores o no. Lo mismo pasa con los parmetros que indican si el usuario dispone de software de video o audio. En el caso se disponga de software para alguno de ellos, directamente no se envian los ficheros correspondientes a audio o video. La tabla 4, resume el comportamiento del sistema teniendo en cuenta el Color y la disponibilidad del software correspondiente a Video o Sonido.

Valores posibles Colores Color Escala de grises S Software de video No S Software de sonido No

Tratamiento Elementos multimedia en color original Imagen y video en escala de grises Se enva el fichero de video No se enva el fichero de video Se enva el fichero de audio No se enva el fichero de audio

Tabla 4- Parmetros que influyen en el tipo de perfil a aplicar.

En la Tabla 5, se muestra un esquema nos que describe las adaptaciones posibles que se realizan, sobre cada uno de los respectivos elementos multimedia, segn el perfil a aplicar.

Perfil 0 Imgenes

Perfil 1 Originales con el tratamiento de color correspondiente

Perfil 2 Imgenes reducida a la mitad y con el tratamiento de color correspondiente

Perfil 3 Imgenes reducidas a una cuarta parte del original y con el tratamiento de color correspondiente Secuencia de 5 imgenes sobre las que se realiza el tratamiento de imgenes definido en el perfil 3

No se colocan los elementos multimedia en el documento final

Si tiene el software necesario, se enva el original con el tratamiento de color correspondiente. Caso contrario, se realiza el mismo tratamiento que el Perfil 2 Si tiene el software necesario se enva el original

Secuencia de 10 imgenes sobre las cuales se realizar el tratamiento de imgenes del Perfil 2

Video

Sonido

Si tiene el software necesario se enva el original

Si tiene el software necesario se enva el original

Tabla 5 Esquema de los elementos enviados segn el perfil definido

Pagina 64

4.2.1.4 Fase 4 Obtencin del documento HTML adaptado


En esta fase se realiza la adaptacin del documento HTML solicitado, aplicando una serie de plantillas XSLT sobre el documento. El XSLT permite indicar como se ha de transformar la estructura de un documento HTML y es el que determina, a travs de las variables de entrada, que etiquetas se colocan en el documento final y cuales se modifican.

4.2.1.5 Fase 5 Asignacin de valores


Para poder ver en funcionamiento esta herramienta de adaptacin o Analizador de Contenidos, se ha optado por desarrollar una interfaz a travs de la cual un usuario, desde un navegador, puede asignar valores a las variables que se han considerado. A travs de esta interfaz, el usuario indica el estado del sistema. A partir del momento que el usuario asigna estos valores, todos los documentos HTML de este servidor Web se adaptan al valor de estos valores, independientemente del estado real del sistema. As, a travs de este simulador, se puede probar como acta la herramienta en cada una de las posibles combinaciones.

4.2.2 El protocolo HTTP


El protocolo HTTP ha sido una de las primeras alternativas a utilizar, como una herramienta para la definicin de las caractersticas del dispositivo de acceso. Hemos sealado en un apartado anterior, el hecho de intentar, como primera medida, reutilizar lo ya establecido durante la conexin, a fin de no cargar la red con aplicaciones o algn tipo de tecnologa extra. HTTP se basa en sencillas operaciones de solicitud / respuesta. Un cliente establece una conexin con un servidor y enva un mensaje con los datos de la solicitud. El servidor responde con un mensaje similar, que contiene el estado de la operacin y su posible resultado. Las cabeceras existentes en las peticiones podran tericamente aportar informacin relativa al cliente. Todo depende, por una parte, si esta informacin es incluida en la peticin ya que el navegador no necesariamente la enva; y por otra parte si puede ser recogida por el servidor, ya que depende de cmo est configurado el formato de sus logs. Decimos tericamente, pues en la especificacin del protocolo [BER96] [FIE99], estas etiquetas estn detalladas, pero como dijimos, depender del navegador utilizado, que esa informacin pueda ser enviada. Vale la pena tener en cuenta que existe una propuesta para la definicin de las caractersticas del cliente, realizada por EIA (Easy Internet Association in Japan) de 1997 [KAM97] y que la World Wide Web Consortium (W3C) est desarrollando un estndar para los procesos para la definicin de la capacidades del dispositivo del cliente y las preferencias del usuario [W3C99-1], por el cual no podemos perder de vista esta herramienta. Otra de las caractersticas a tener en cuenta del HTPP es la caracterstica de conexin persistentes y no persistentes, que particularmente tiene el HTTP/1.1. En las no persistentes, cada conexin TCP es cerrada despus de que el servidor enve el objeto y por lo tanto no es persistente para otro objeto. Si el objeto recibido tiene otros objetos se debe repetir el proceso, lo cual suscita el inconveniente de establecer una nueva conexin para cada objeto. Hay que tener en cuenta que para cada conexin se deben definir variables y reservar espacio en el buffer, por lo que estamos saturando el servidor. Esto no ocurre en las conexiones persistentes, mejorndose, de esta manera, notablemente el rendimiento en la conexin. Esta caracterstica, podra ser tenida en cuenta, a la hora de considerar el clculo de las transferencias a realizar bajo determinadas condiciones del estado de la red [HEI97] [KRI99] [SPE96] [TOU96]. Por ltimo, las cabeceras (el conjunto de variables que se incluyen en los mensajes http) pueden aparecer en las peticiones del cliente o en las respuestas del servidor. No todas las
Pagina 65

cabeceras definidas, llegarn a tener un inters particular para nuestros estudios, por lo que habr que definir cuales son las que pueden aportar algo. A priori, podemos decir que etiquetas tales como : Content-Type, Content-Length, Content-Encoding, Accept, Authorization, From, Referer, User-agent, pueden resultar de inters. Ahora bien, de encontrar cual es el conjunto de etiquetas que puedan ser de utilidad y sabiendo que en toda peticin del cliente, no siempre se incluyen la totalidad de etiquetas existentes, cabe entonces la pregunta cmo hacemos para indicarle al cliente, directa o indirectamente, que enve dichas etiquetas?. De momento, sabemos que dependiendo del tipo de navegador, cada uno tiene configurado particularmente un estndar de etiquetas a enviar. En principio, es posible configurar en los distintos navegadores las etiquetas a enviar. As por ejemplo, el Internet Explorer, posee un mdulo adicional, el Internet Explorer Kit, que en principio nos permitira configurar algunas de las etiquetas; o en el Mozilla, un navegador de cdigo abierto, podramos recuperar la porcin de cdigo que configura el conjunto de etiquetas a enviar, modificarlo y recompilar nuestra propia versin, a fin de distribuirla. Situacin, probablemente vlida para el Netscape tambin. Las posibilidades de reutilizacin de las caractersticas del protocolo HTTP, son perfectamente vlidas. Queda para futuros anlisis y experimentos, la decisin final de considerar su implementacin.

4.3 Conclusiones
Hemos presentado as el SHAAD - Sistema Hipermedia Adaptable, Adaptativo y Dinmico para la adaptacin de contenidos. Este sistema intenta cubrir desde diferentes puntos de vista la amplia gama de trabajos relacionados con la adaptacin de contenidos hipermedia. As, a travs del anlisis de diversas tcnicas para la definicin de las caractersticas para la adaptacin (caractersticas del usuario, caractersticas del dispositivo de acceso del cliente, tipo de acceso, estado de la red y carga de la red) hemos tratado de englobar los distintos puntos de vista y definir a travs de un modelo nico nuestro punto de partida para la adecuacin de contenidos Un Analizador de Contenidos implementado en XML se encuentran en una etapa de implementacin, a travs del cual se realiza una seleccin inteligente de los objetos que conforman una pgina para luego regenerarla atendiendo algunas caractersticas de adaptacin. Nuestro modelo, estrictamente modular, nos permitir trabajar sobre el amplio espectro de aspectos y plantear de esta forma soluciones parciales a un problema que globalmente puede resultar excesivamente complejo debido al espectro de caractersticas que hay que analizar. En trabajos futuros se realizar el anlisis, discusin y seleccin de los mecanismos, herramientas y/o mtodos para la definicin de caractersticas para la adaptacin. Para finalmente implementar en SHAAD la adaptacin de contenidos en base a estas caractersticas.

Pagina 66

5 - Plan de Trabajo
Despus de haber realizado un anlisis preliminar de las diferentes caractersticas que se deberan tener en cuenta para definir la arquitectura del SHAAD, ser necesario profundizar en el anlisis de la tecnologa a implementar sobre el Motor de Decisin. Adems, hay diversos aspectos que se deben continuar estudiando a fin de llegar a obtener las herramientas adecuadas para el desarrollo del sistema. A continuacin se muestra el cronograma de actividades necesario para la obtencin del sistema propuesto en el plazo de dos aos.

CRONOGRAMA DE ACTIVIDADES TRIMESTRE/AO

ACTIVIDADES
4/02 1/03 2/03 3/03 4/03 3/04 2/04 3/04

Estudio y seleccin de los mecanismos para la definicin de las caractersticas y/o preferencias del usuario Estudio y seleccin de los mecanismos de definicin del tipo de dispositivo de acceso Estudio y seleccin de los mecanismos de definicin del estado de la red Estudio y seleccin de los mecanismos de definicin del estado de carga del servidor Desarrollo del mdulo de contenidos Desarrollo y puesta a punto del analizador de contenidos Estudio de la factibilidad y necesidad de la implementacin de tcnicas de transformacin, transcodificacin y compresin de datos Estudio de las ventajas y desventajas de implementar los mecanismos de adaptacin sobre el servidor o sobre un proxy Anlisis de la tecnologa a implementar sobre el Motor de Decisin Implementacin del SHADD Redaccin de papers para la presentacin en congresos y revistas. Redaccin del documento de Tesis Doctoral

Pagina 67

6 - Referencias
[ABD99] Tarek F. Abdelzaher, Nina Bhatti, Web Content Adaptation to Improve Server Overload Behavior, The 8th International World Wide Web Conference, Toronto, Ontario, Canada, 1999. [ABD99-1] Tarek F. Abdelzaher, Nina Bhatti, Web server qos management by adaptive content delivery, Int. Workshop on Quality of Service, June 1999. [APER01] Andrew Perkis, Yousri Abdeljaoued, Charilaos Christopoulos, Touradj Ebrahimi and Joe Chicharo, Universal Multimedia Access from Wired and Wireless systems, Birkhauser Boston transactions on Circuits, Systems and Signal Processing; Special issue on Multimedia Communications, Vol. 20. , No. 3, 2001, pp. 387-402 [APER01-1] UMA Project - Andrew Perkis, NTNU-Department of Telecommunications, Leif Arne Rnningen, NTNU-Department of Telematics http://129.241.2.13/UMA/IKT2010-UMA.html [BAK99] Scott M. Baker and Bongki Moon. Distributed cooperativeweb servers. Computer Networks, 31(11-16):1215-1229, 1999. [BER96] T. Berners-Lee, R. Fielding, and H. Frystyk, Hypertext Transfer Protocol{HTTP/1.0, RFC 1945 - Internet Engineering Task Force, May 1996. [BIC99] T. Bickmore and B. Schilit, "Digestor: Device Independent Access to the World Wide Web", proceedings of the Sixth International World Wide Web Conference, Santa Clara, California, 1999 . [BIL99] Daniel Billsus, Improving User Model Acquisition from Labeled Text Documents, Proceedings of the 2nd Workshop on Adaptive Systems and User Modelling on the WWW. [BRA92] P. De Bra, G. J. Houben, Y. Kornatzky. An Extensible Data Model for Hyperdocuments. Proc. 4th ACM Conference on Hypertext, Milan, pp. 222231, 1992. [BRA98] P. De Bra and L. Calvi. Towards a Generic Adaptive Hypermedia System. Proc. Second Workshop on Adaptive Hypertext and Hypermedia, Pittsburgh, pp. 511, 1998. [BRA99] Paul De Bra, Design Issues in Adaptive Web-Site Development, Proceedings of the 2nd Workshop on Adaptive Systems and User Modelling on the WWW [BRA99-1] De Bra, P., Houben, G.J., Wu, H., AHAM: A Dexter-based Reference Model for Adaptive Hypermedia. Proceedings of ACM Hypertext99, Darmstadt, pp. 147-156, 1999. [BRU96] P. Brusilovsky. Methods and Techniques of Adaptive Hypermedia. User Modeling and User-Adapted Interaction, Vol. 6, pp. 87129, Kluwer academic publishers, 1996. [BRU01] Peter Brusilovsky, Adaptive Hipermedia, User Modelling and User-Adapted Interaction 11: 87-110, 2001, Kluwer Academic Publishers, Netherlands [CAI02] CAIDA - Cooperative Association for Internet Data Anlysis - University of Californias San Diego Supercomputer Center. http://www.caida.org [CAM00] Stefano Campadello, Heikki Helin, Oskari Koskimies, Pauli Misikangas, Mikko
Pagina 68

Mkel, Kimmo Raatikainen, Using Mobile and Intelligent Agents to Support Nomadic Users, 6th International Conference on Intelligence in Networks (ICIN2000), 2000, Bordeaux, France. [CAM99] S.Campadello, K.Raatikainen - Department of Computer Science, University of Helsinki, Finland Agents in Personal Mobility. Proceedings of the First International Workshop on Mobile Agents for Telecommunication Application MATA99. Otawa Canada October 6-8-1999. World Scientific pp 359-374. [CHE00] Chen, J.L., Yang, Y.D., and Zhang, H.J. An Adaptive Web Content Delivery System. Proc. AH2000 (Tronto, Italy, 2000) Springer Press, 284-288. [CLA99] K. Claffy and S. McCreary. Internet measurement and data analysis: passive and active measurement, http://www.caida.org/Papers/Nae/4hansen.html, 1998. [CLA99-1] K. Claffy. Internet measurement and data analysis: topology, workload, performance and routing statistics, NAE99 workshop paper, 1999. [DAV96] F. Davoli, O. Khan, and P. Maryni, Estimating the Available Bandwidth for Real-time Traffic over Best Effort Networks, in Protocols for High-Speed Networks V, W. Dabbous and C. Diot, Eds., 1996, pp. 312, IFIP, Chapman & Hall. [DAVI99] B. D. Davison. Adaptive Web Prefetching. In Proceedings of the 2nd Workshop on Adaptive Systems and User Modeling on the WWW, pages 105--106, Toronto, May 1999 [DHW99] De Bra, P., Houben, G.J., Wu, H., AHAM: A Dexter-based Reference Model for Adaptive Hypermedia. Proceedings of ACM Hypertext99, Darmstadt, pp. 147-156, 1999. [DOW99] A.B. Downey, "Using Pathchar to Estimate Internet Link Characteristics,', in ACM SIGCOMM, Sept. 1999. [FAB00] R. Fabregat, J.L. Marzo, C.I. Pea, "Teaching Support Units", Computers and Education in the 21st Century: Kluwer Academic Publishers, 2000. [FIE97] R. T. Fielding and G. Kaiser, The apache http server project", IEEE Internet Computing, vol. 1, no. 4, pp. 88-90, July 1997 [FIE99] R. T. Fielding, J. Gettys, J. C. Mogul, H. Frystyk, L. Masinter, P. Leach, and T. Berners-Lee. Hypertext Transfer Protocol --- HTTP/1.1. RFC 2616, http://ftp.isi.edu/in-notes/rfc2616.txt, June 1999 [GAR93] F. Garzotto, P. Paolini, D. Schwabe. HDM A model-based approach to hypermedia application design. ACM Transactions on Information Systems, 11:1, pp. 123, 1993. [HAL90] F. Halasz and M. Schwartz. The Dexter Reference, Model. In Proc. NIST Hypertext StandardizationWorkshop, pp. 95133, 1990. [HAL94] F. Halasz and M. Schwartz. The Dexter Hypertext Reference Model. Communications of the ACM, Vol. 37, nr. 2, pp. 3039, 1994. [HEI97] John Heidemann, Katia Obraczka, and Joe Touch. Modeling the performance of HTTP over several transport protocols. IEEE/ACM Transactions on Networking, 5(5), October 1997. [HPR01] Habitat-ProTM Environment, Agents Inspired Technologies S.A, University of Girona, Girona, Spain, 2001, http://www.agentsinspired.com.
Pagina 69

[IYE97] A. Iyengar, E. MacNair, and T. Nguyen. An Analysis of Web Server Performance. In Proceedings of GLOBECOM97, volume 3, pp. 1943-1947, November 1997. [JAC97] Van Jacobson, Pathchar a tool to infer characteristics of Internet paths, Tech. Rep., Network Research Group, Lawrence Berkeley National Laboratory, Berkeley, CA, April 21 1997, available at: ftp://ftp.ee.lbl.gov/pathchar. [KAM97] Tomihisa Kamada, et. al., Client-specific Web Services by using User Agent Attributes, 12/97, http://www.w3.org/TR/NOTE-agent-attributes. [KAR97] David Karger, Eric Lehman, Tom Leighton, Matthew Levine, Daniel Lewin and Rina Panigrahy. Consistent hashing and random trees: Distributed cachine protocols for relieving hot spots on the World Wide Web. In Proceedings of the Twenty-Ninth Annual ACM Symposium on Theory of Computing, pages 654-663 , 1997. [KAR99] David Karger, Tom Leighton, Danny Lewin, and Alex Sherman. Web caching with consistent hashing. In Proc. of 8th International World--Wide Web Conference, Toronto, Canada, 1999. [KLE00] Nomadic Working Team (NWT). 1995. "Nomadicity in the NII," Cross-Industry Working Team, Corporation for National Research Initiatives, Reston, Va. [KOS00] O.Koskimies, K.Raatikainen Department of Computer Science, University of Helsinki, Finland Partitioning Aplications with Agents. Second International Workshop on Mobile Agents for Telecommunication Applications (MATA2000), pages 79-93. Lecture Notes in Computer Science, Springer Verlag, September 2000. [KRI99] Balachander Krishnamurthy, Jeffrey Mogul, and David Kristol. Key differences between HTTP/1.0 and HTTP/1.1. In Eighth International World Wide Web Conference, Toronto, Canada, May 1999. [KRO97] T. M. Kroeger, D. D. E. Long, and J. C. Mogul. Exploring the Bounds of Web Latency Reduction from Caching and Prefetching. In Proceedings of the USENIX Symposium on Internet Technologies and Systems (USITS '97), Dec. 1997. [LI00] K. Li and S. Jamin. A measurement-based admission controlled web server. In Proceedings of IEEE INFOCOM 2000, Tel Aviv, Israel, March 2000. [MA00] Wei-Ying Ma, Ilja Bedner, Grace Chang, Allan Kuchinsky, and HongJiang Zhang, A framework for adaptive content delivery in heterogeneous network environments, MMCN2000, San Jos, California, 2000. [MAR99] Mauro Marinilli, Alessandro Micarelli and Filippo Sciarrone, A Case-Based Approach to Adaptive Information Filtering for the WWW, 7th International Conference on User Modeling, Banff, Canada, 1999. [MARY00] Piergiulio Maryni and Franco Davoli. Load Estimation and Control in Best-Effort Network Domains, JOURNAL OF NETWORK AND SYSTEMS MANAGEMENT, Vol. 8, No. 4, December 2000 [MER02] "SHAAD: Adaptable, Adaptive and Dynamic Hypermedia System for content delivery ", David Mrida, Ramn Fabregat, Jose-Luis Marzo; Workshop on Adaptive Systems for Web Based Education (WASWE2002) Mlaga (Espaa), 28 may 2002. [MER02-1] "SHAAD: sistema hipermedia adaptable, adaptativo y dinmico para la entrega de contenidos hipermedia", David Mrida, Ramn Fabregat; accepted to the JENUI 2002. Cceres (Espaa), 10-12 july 2002.

Pagina 70

[MIS00] P.Misikangas, K.Raatikainen - Department of Computer Science, University of Helsinki, Finland Agent Migration Between Incompatible Platforms. ICDCS 2000. [MIS99] P.Misikangas - Department of Computer Science, University of Helsinki, Finland Intelligent Agents form Nomadic Users.In FDPW99. [MIS99-1] Pauli Misikangas, Mikko Mkel, Kimmo Raatikainen, Predicting QoS for Nomadic Applications Using Intelligent Agents, Impact99 Workshop. [MOH99] R. Mohan, J. R. Smith, and C.-S. Li. Adapting multimedia internet content for universal access. IEEE Trans. Multimedia, l(l):104 - 114, March 1999. [NOR00] Nortel Networks Corporation. FIPA-OS V1.3.3 Distribution Notes. Open Source, 2000. [OPP94] Oppermann R. (1994). Introduction. Adaptive User Support (Ed. Oppermann R.), Lawrence Erlbaum. Associates, Hillsdale, New Jersey, pp1-13. [OPP97] Reinhard Oppermann, Rossen Rashev, Kinshuk, Adaptability and Adaptativity in Learning Systems, Knowledge Transfer (Volume II) (Ed. A. Behrooz), 1997, pAce, London, UK, pp173-179 (ISBN 900427-015-X) [PE02] "Un sistema de tutora inteligente adaptativo considerando estilos de aprendizaje", Clara Ins Pea, Jose-L Marzo, Josep Lluis de la Rosa, Ramn Fabregat, enviado a IE2002, Vigo (Espaa), Noviembre 20-22, 2002. [PE02-1] "Student modeling using intelligent agents in a web-based teaching and learning environment", Clara Ins Pea, Jose-L Marzo, Josep Lluis de la Rosa, submitted to AIA2002, Mlaga (Spain), September 9-12, 2002. [PE02-2] "Intelligent Agents in a Teaching and Learning Environment on the Web", Clara Ins Pea, Jose-L Marzo, Josep-Lluis de la Rosa, (to be presented) ICALT2002, Kazan (Russia), September 9-12, 2002. [PER97] M. Perkowitz and O. Etzioni. Adaptive web sites: an AI challenge. In Proc. 15th Int. Joint Conf. AI, pages 16--23, 1997. [PER98] M. Perkowitz and O. Etzioni. Adaptive Web sites: automatically synthesizing Web pages. In Proceedings of Fifteenth National Conference on Artificial Intelligence, Madison, WI, 1998. [PER99] M. Perkowitz and O. Etzioni. Adaptive web sites: Conceptual cluster mining. In Proc. 16th Int. Joint Conf. AI, pages 264--269, 1999. [RAA99] Kimmo Raatikainen, Lassi Hippelinen, Heimo Laamanen, Matti Turunen, Monads Adaptation Agents for Nomadic Users, World Telecom '99 [RAA99-1] K.Raatikainen - Nokia, Sonera Finland, University of Helsinki. Monads Response to OMG Request for Information on Agent Technology in OMA. July 30, 1999. [ROD01] P. Rodriguez, C. Spanner, and E. W. Biersack, " Analysis of Web Caching Architectures: Hierarchical and Distributed Caching" Published in IEEE/ACM Transactions on Networking, August 2001) [ROD99] P. Rodriguez, C. Spanner, and E. W. Biersack, "Web caching architectures: Hierarchical and distributed caching," in Proceedings of the 4th International Web Caching Workshop, San Diego, April 1999 [SCH95] D. Schwabe, G. Rossi. The Object-Oriented Hypermedia Design Model.

Pagina 71

Communications of the ACM, Vol. 38, nr. 8, pp. 4546, 1995. [SLI98] C.-S. Li, R. Mohan, and J. R. Smith. Multimedia content description in the InfoPyramid. In IEEE Proc, Int. Conf. Acoust., Speech, Signal Processing (ICASSP), Seattle, WA, May 1998. Special session on Signal Processing in Modern Multimedia Standards. [SMI98] J.R. Smith, R. Mohan, and C.S. Li, "Transcoding internet content for heterogeneous client devices,"Proc. IEEE Int'l. Conf. Circuits and Systems, Monterey, CA, June 1998. [SMI99] J. R. Smith, R. Mohan, and C-S. Li. Scalable Multimedia Delivery for Pervasive Computing, ACM Multimedia, Orlando, FL, November 1999. [SPE96] Spero, S., Analysis of HTTP Performance Problems. http://www.w3.org/Protocols/HTTP/1.0/HTTPPerformance.html , July 1994. [SPY02] Spyglass - http://www.opentv.com/redirect.html [TOU96] Touch, J., J. Heidemann, K. Obraczka, "Analysis of HTTP Performance," USC/Information Sciences Institute, June, 1996 [W3C99] World Wide Web Consortium, Web Content Accessibility Guidelines 1.0, http://www.w3.org/TR/WAI-WEBCONTENT [W3C99-1] W3C Composite Capability/Preference Profiles (CC/PP). http://www.w3.org/TR/NOTE-CCPP/ [YANG00] Yudong Yang, Jinlin Chen, and Hongjiang Zhang, Adaptive Delivery of HTML Contents, 9th International World Wide Web Conference The Web: The Next Generation, Amsterdam, 2000.

Pagina 72

Вам также может понравиться