Diseo e implementacin de un sistema de anticipacin de
fallas basado en mediciones en tiempo real para un ISP de
Banda Ancha en Redes HFC
Patricia Herrera, Laura Vargas, Orlando Micolini
Facultad de Ciencias Exactas, Fsicas y Naturales, Universidad Nacional de Crdoba(5000) Avda. Vlez Srsfield 1611, Crdoba, Argentina
Abstract usuario. Estos se deben, bsicamente, a
Este artculo presenta el diseo y la defectos en la construccin de la red por implementacin de un sistema de medicin y alarmas en tiempo real cuya finalidad es desconocimiento del personal tcnico optimizar el rendimiento de operacin de sobre la forma correcta de manipulacin servicios de una red ISP (Internet Service del cable y otros elementos fsicos. Provider) del tipo HFC (Hybrid Fiber Cupper), Tambin en el mantenimiento mediante el uso de mediciones y anlisis de preventivo y correctivo se generan trfico. Los datos relevantes sobre los servicios se obtienen mediante el protocolo SNMP deficiencias en la calidad del servicio y (Simple Network Management Protocol) que en el tiempo efectivo de trabajo, por transmite la informacin entre la entidad gestora desconocimiento de los procedimientos y los agentes que se ejecutan en los dispositivos a seguir para detectar las causas de de red. El sistema realizado brinda grficos insercin de ruido o interferencias, entre sobre los servicios ms importantes, los que facilitan el anlisis y, adems, una base de datos otras causas. que almacena eventos y estados con el historial Se plante como objetivo disear e de uso y fallos. Cabe destacar que este sistema implementar un sistema de alarmas que fue desarrollado e implementado para cubrir anticipe fallas en una red optimizando requerimientos reales de una empresa de los servicios de la misma en tiempo comunicaciones con el fin de mostrar el estado real de la red al personal tcnico y mejorar la real, a travs de una visin precisa del calidad de servicio, con estrategias comportamiento de la misma, obtenida comprobadas y planificadas. mediante mediciones seleccionadas, y adems, almacenar las mediciones ms Palabras clave: administracin de redes, importantes en una base de datos, calidad de servicio, DOCSIS, HFC, SNMP. presentando tambin resultados en forma grfica. I. Introduccin El sistema se desarroll y prob en una En la actualidad, muchas compaas de empresa en particular, Communication comunicaciones ofrecen el servicio de Partner, que ofrece servicios en Internet de banda ancha por medio de telecomunicaciones (redes, telefona e redes HFC [1]. De acuerdo con la Internet). Esta no posea un control de evolucin que esta tecnologa ha los servicios que brindan los equipos experimentado, las empresas que la terminales cable-mdem (son de utilizan han podido incrementar los diferentes marcas tales como Motorola, servicios que ofrecen, tomando en Arris, Cisco, Scientific Atlanta) [2] [3], cuenta las necesidades de la sociedad y y no haca mediciones del el inters por satisfacerlas. comportamiento de la red en forma Actualmente, en las redes HFC automtica. La empresa se inici en el existentes se presentan diversos 2001 y desde su formacin ha problemas que inciden directamente en mantenido una poltica de adaptacin a la calidad del servicio ofrecido al las exigencias de un mercado que se encuentra en continuo desarrollo. La Para la obtencin de los requerimientos aplicacin del sistema se puede se hizo uso del proceso JAD (Joint extender a otras empresas que se Application Development), que es una dediquen a brindar los servicios de tcnica exploratoria popular televisin e Internet por cable. desarrollada inicialmente por IBM al Este artculo se organiza de la siguiente final de 1970 y que luego se expandi y manera: en el punto II se presentan un perfeccion [4]. La misma incluye a los esquema del sistema, requerimientos, usuarios como participantes activos en casos de uso, en el III los resultados, en el proceso de desarrollo. En este caso el IV las conclusiones y se plantean usuarios son los ingenieros y tcnicos a trabajos futuros. cargo de la provisin de servicios de comunicaciones en la empresa, quienes II. Pasos del Diseo del Sistema de conocen los reclamos de los tomadores Alertas del servicio y las fallas ms comunes II.A Objetivos que se presentan en la prestacin de Objetivo General estos. Este mtodo se basa en que: Disear e implementar un sistema de Las personas que llevan a cabo alarmas que anticipe fallas en una red un trabajo tienen la mejor optimizando los servicios de la misma comprensin del mismo. en tiempo real, a travs de una visin Las personas con conocimientos precisa de su comportamiento, obtenida de las tecnologas tienen la mediante mediciones seleccionadas. mejor comprensin de las Objetivos Particulares posibilidades de estas. Analizar las fallas a que pueda La gente que trabaja en un rea verse sometida la red. tiene una percepcin valiosa Analizar qu tipos de datos sobre el papel que debe cumplir relevantes se deben obtener para el sistema en el entorno donde prevenir las fallas. funcionar. Disear los informes estadsticos Tambin se examinaron otras fuentes a obtener. para la obtencin de los requerimientos, Generar los informes o traps que tales como manuales del cable-mdem, indicarn los distintos sucesos. el relevamiento del sistema (su Comparar metodologas, arquitectura), y los lmites tericos del procedimientos y software mismo. existentes para administrar una A partir de todas las fuentes, se elabor red y elegir entre ellos un listado. En la tabla 1, se presentan justificndolo. cinco requerimientos a modo de Disear un sistema de alarmas ilustracin. que mejore la administracin de Descripcin de Requerimientos la red. Monitorear los servicios relevantes, alertando Documentar los datos relevantes cuando el comportamiento de los mismos no sea el deseado. en una base de datos para Optimizar el rendimiento en tiempo real, a facilitar futuras mejoras a la red travs de una visin precisa de su y disminuir los tiempos comportamiento mediante mediciones seleccionadas. requeridos para solucionar Analizar los problemas que se presentan problemas. mediante niveles de alertas. Verificar y validar una La implementacin se debe adaptar a todos los clientes que usan redes HFC. implementacin. La solucin debe ser factible y clara para II.B Obtencin de requerimientos administrar. Tabla 1- Listado de Requerimientos Cabe mencionar que los requerimientos En la tabla 2 se muestra un listado de fueron minuciosamente validados por el objetivos a cumplir para satisfacer los cliente. requerimientos del sistema. II.C Metodologa Empleada II.D Casos de Uso del Sistema Para el desarrollo de este proyecto se A partir del anlisis de los decidi implementar un ciclo de vida requerimientos, se plantearon los casos iterativo [5] ya que permite la reduccin de uso [6] del sistema, ya que son de los riesgos, incorpora objetivos de herramientas simples que describen el calidad e integra el desarrollo con el comportamiento deseado. En la Figura 1 mantenimiento; adems admite mejoras se puede ver el diagrama e incorporacin de nuevos correspondiente que muestra las requerimientos durante su desarrollo. interacciones del sistema con el usuario, En cada iteracin se realizan consultas el dispositivo y la base de datos. al equipo, luego se evalan y analizan los resultados obtenidos. Si el estado es vlido se implementa, se prueba y se acepta. Id Nombre Objetivo 1 Bsqueda de Investigar que estados informacin es importante. 2 Seleccin de Elegir y estudiar estados la informacin ms apropiada. 3 Estados relevantes Seleccionar los Figura 1- Casos de Uso estados relevantes que II.E Arquitectura del Sistema mantiene el Con los objetivos y los requerimientos estado correcto se obtiene una arquitectura de alto nivel de la red. 4 Rango de valores Estudiar los del sistema. En la figura 2 se muestran valores ptimos sus elementos constituyentes, los que se que miden la especifican a continuacin: red. MIB (Management Information 5 Eleccin de eventos Calificar los Base) [7]: es un repositorio de sucesos. datos de gestin que se recopilan 6 Definicin de Elegir intervalo tiempo en los cable- de tiempo entre a partir de cada uno de los cable- mdems monitoreos. mdems. 7 Seleccin de Elegir qu Sistema de alarmas: para estados a almacenar estados son visualizacin del estado del fundamentales para cable-mdem en tiempo real, almacenarlos en genera alertas cuando el la base de datos. comportamiento de los mismos 8 Definicin de Elegir el tiempo no es el deseado. tiempo en la base entre registro de Sistema de Gestin Base de de datos datos 9 Seleccin de Elegir los Datos: almacena los estados no estados a graficar estados a deseados del cable mdem para monitorear a realizar consultas sobre los travs de las mismos. grficas. Sistema de Grficos: se generan Tabla 2 - Listado Detallado de Requerimientos y muestran los grficos de los estados relevantes del cable- Herramienta Aplicacin Observaciones
mdem. PhpMyAdmin Aplicacin Utilizado por su
[12] que permite simplicidad, con administrar el fin de gestionar bases de y generar la base datos de datos del MySQL sistema MRTG [13] Software de Permite realizar grficas grficas de dispositivos SNMP y se adapta fcilmente al cumplimiento de requerimientos especficos Vixie-cron [14] Paquete de Ejecuta las tareas Figura 2- Esquema del Sistema Linux de manera programada y es II.F Entorno de Desarrollo usado por el Para seleccionar las herramientas se cliente tuvo en cuenta que: Netkit-telnetd Paquete de Contiene el Dan cumplimiento a los [15] Linux cliente Telnet por lneas de requerimientos del sistema. comandos, Son usadas en la instalacin. permite interactuar con el Son usadas por los clientes. dispositivo Son de libre distribucin. usando el Por su documentacin. protocolo Telnet y es usado por el Por la comunidad y soporte que cliente brindan. Tcpdump Herramienta En lnea de [16] de Linux comandos permite Facilidad de configuracin, realizar capturas y adaptndose a las necesidades y analizar el trfico capacidades. en tiempo real Net-snmp Conjunto de Usado para Despus de un exhaustivo anlisis y aplicaciones implementar el pruebas se opt por el conjunto de protocolo SNMP herramientas que se muestra en tabla 3. en IPv4 e IPv6 Herramienta Aplicacin Observaciones Net/Ping.php Paquete de Librera necesaria Linux para diagnosticar Linux Sistema Cumple con los el estado del operativo, requerimientos y cable-mdem distribucin soporta todas las Gentoo [8] herramientas que se Tabla 3 Herramientas usaran en el proyecto. II.G Desarrollo del sistema Apache [9] Servidor web Soporta php y Para cumplir con el listado de los permite previsualizar y objetivos detallados en la tabla 2 se probar el cdigo procedi de la siguiente manera: mientras se est desarrollando el sistema. 1) Bsqueda de estados: MySQL [10] Sistema de Es usado por el Se realizaron consultas a los cable- gestin de cliente y cumple con base de datos los requerimientos. mdems a travs del protocolo SNMP, PHP [11] Lenguaje de Facilita la desde una consola de Linux con el programacin incorporacin de siguiente formato: snmpwalk [version] libreras especficas para [IP] [comunidad] [OID], con la redes y permite finalidad de recopilar informacin de crear interfaz estados para luego seleccionar los grfica para el usuario as como fundamentales para el monitoreo. la conexin con MySQL. 2) Seleccin de estados: La lista de estados seleccionada, determinan las condiciones de funciona para los mdems compatibles transmisin y recepcin de las seales. con DOCSIS [17]. Se realizaron pruebas con Arris, Cisco, y Motorola. 4) Rango de valores y 5) Eleccin de La tabla 4 muestra y describe algunos eventos: de los servicios ms importantes Existe un rango de seal, en el que se obtenidos a travs de consultas con logra un funcionamiento adecuado, esto snmpwalk. Los valores fueron validados se refiere a niveles de transmisin, con las herramientas antes recepcin y relacin seal-ruido del mencionadas. cable mdem. Se realiz un estudio minucioso a partir MIBS (Nombre) Descripcin de la norma DOCSIS, consultando a los docsIfSigQUnerroreds Especifica el nmero de palabras de expertos que operan en la empresa y a cdigo recibido en otros, verificando finalmente a travs de este canal sin errores docsIfSigQCorrecteds Especifica el nmero estadsticas sobre los usuarios. Se de palabras de establecieron los niveles indicados en cdigo recibido en este canal con las tablas 5 a 8. errores corregibles docsIfSigQUncorrectables Especifica el nmero Niveles de Transmisin Tx de palabras de cdigo recibido en Upstream Power este canal con Alertas Rangos errores OK Entre 40 y 55 dBmV irrecuperables (40 <= Tx <= 55) docsIfDownChannelInterleave Especifica el Warning Entre 35 y 40 dBmV entrelazado de los (35 <= Tx < 40) canales de QAM Warning Entre 55 y 60 dBmV docsIfDownChannelPower Especifica la medida (55 < Tx <= 60) de la Potencia Critical Menores a 35 dBmV docsIfSigQSignalNoise Especifica la (Tx < 35) relacin seal / ruido Se puede considerar hasta 60 Mayores a 60 dBmV percibido por este dBmV (60 < Tx) canal en [dB] Tabla 5- Nivel de Transmisin docsIfCmStatusTxPower Especifica la potencia de transmisin para el Niveles de Recepcin Rx canal ascendente, es Downstream Power decir significa el Alertas Rangos nivel de TX del OK. Debe estar lo mas cercano a Entre -10 y 10 dBmV mdem en [dBmV] cero (-10 <= RX <= 10) Tabla 4- Lista de Servicios Warning Entre -10 y -14 dBmV (-10 < RX <= -14) 3) Estados relevantes Warning Entre 10 y 14 dBmV Los seleccionados fueron [18] [19]: (10 < Rx <= 14) SigQSignalNoise, especifica la Critical Mayores a -15 dBmV ( Rx => -15) relacin seal-ruido o SNR, en Critical Mayores a 15 dBmV ( Rx => 15) el downstream. Tabla 6 Nivel de Recepcin DownChannelPower, denominada Rx determina la Niveles de Ruido SNR potencia del Downstream. SNR para QAM256 CmStatusTxPower, denominada Alertas Rangos OK Entre 30 y 38 dB (30 como Tx define la potencia del <= SNR <= 38) upstream. Warning Entre 25 y 30 dB (25 <= SNR < 30) Se seleccionaron estos estados como los Critical Menores a 25 dB principales porque son parmetros (SNR < 25) Es posible, no hay un limite Mayores a 38 dB (38 fundamentales en las comunicaciones y superior < SNR) Tabla 7- Relacin Seal/Ruido para QAM 56 y la capacidad de almacenamiento Niveles de Ruido SNR disponible. SNR para QAM64 Alertas Rangos OK Entre 27 y 38 dB (27 9) Seleccin de estados a graficar: <= SNR <= 38) Los estados a graficar son: SNR, Rx, Warning Entre 24 y 27 dB (24 <= SNR < 27) Tx, el consumo del ancho de banda y Critical Menores a 24 dB valores de FEC (Forward Error (SNR < 24) Es posible, no hay un limite Mayores a 38 dB (38 Correction) tanto de errores corregibles superior < SNR) como de errores irrecuperables. Tabla 8- Relacin Seal/Ruido para QAM 64 Estos son seleccionados por considerarse indispensables, su grfica 6) Definicin de tiempo en los cable- permite un anlisis simple y rpido. mdems: Tambin se ha incluido el grfico de Se estableci como solucin de ancho de banda para monitorear su compromiso que el sistema de alarmas consumo en tiempo real. debe monitorear cada 8 segundos porque los valores SNR, Rx y Tx no III. Resultados varan demasiado con el tiempo, y El sistema desarrollado, llamado tambin porque es adecuado para no cm_monitor, es un sistema de saturar la red con consultas. monitorizacin que analiza los servicios especificados en tiempo real, alertando 7) Seleccin de estados a almacenar: cuando el comportamiento de los El sistema de alertas almacena en la mismos no es el deseado mediante base de datos los estados: SNR, Rx, y mrgenes definidos, interacciona con la Tx. Se guardan los parmetros base de datos almacenando los datos fundamentales si los valores obtenidos relevantes y permite visualizar el estado no se encuentran en los rangos de la red mediante grficos. Emplea una establecidos en el punto 5. interfaz grfica Web para la visualizacin de los servicios, adems 8) Definicin de tiempo en la base de cuenta con documentacin de ayuda datos: para resolver los problemas y el Se consider que el sistema de alarmas chequeo historial de los servicios debe almacenar los datos cada 5 relevantes. minutos, lo que fue especificado En las figuras 3 a 9 se muestran algunas taxativamente por los expertos de la de las pantallas que arroja el sistema. empresa, considerando sus necesidades
Figura 3- Pantalla de Ingreso
Figura 4- Tabla de Informacin del CM
Figura 5- Estados de Downstream y Upstream
Figura 6- Interfaz Grfica para Consultas
Figura 7- Grfico de Relacin Seal/Ruido
Figura 8- Grfico de Potencia de Transmisin
Figura 9- Grfico de Potencia de Recepcin
IV. Conclusiones y Trabajos Futuros Anticipa el funcionamiento En las redes HFC, cuando no se incorrecto. observan los procedimientos correctos Anticipa el escalado de la para manipulacin de cables y equipos, instalacin. se generan deficiencias que facilitan la El sistema ha sido implementado insercin de seales que interfieren la utilizando mdulos y libreras de PHP, seal transmitida y que, y paquetes de Linux, esto proporciona consecuentemente, degradan la calidad una adecuada funcionalidad con el de servicio. El sistema realizado tiene hardware. Adems deja abierta la como objetivo subsanar estos posibilidad de adaptar el cdigo para inconvenientes para lo que detecta y da cualquier tipo o tecnologa de red o alarma en aquellos casos en que se necesidades especficas. Se document produce alguna perturbacin que impide toda la informacin para un posterior el funcionamiento adecuado de los estudio de requerimientos, que equipos. continen y perfeccionen el presente Con la ayuda del protocolo SNMP, se trabajo. obtuvieron los servicios relevantes para El software desarrollado es simple (fcil el monitoreo de los dispositivos de estas de usar, instalar y operar), estable y redes, midiendo su comportamiento. robusto (despus de 180 das no registra Se dise e implement un sistema de anomalas en su funcionamiento), la alarmas optimizando los servicios en base de datos ha crecido en forma lineal tiempo real a travs de mediciones, lo y los valores obtenidos han permitido que permite en forma automtica realizar mejoras en el equipamiento, detectar fallas en la red, facilita la toma atencin y tiempo de respuesta, por lo de decisiones y obtiene eficiencia en el que hoy el operador lo considera til rendimiento de la red. para la explotacin del sistema. El sistema diseado: Si bien est generalizado el uso de Permite calificar los resultados sistemas de monitoreo libre como el segn el nivel de los sucesos. Nagios o el Zenoss, o el Big Brother, es En base a la calificacin, el necesario mayor conocimiento tcnico sistema almacena los datos no para su utilizacin que el requerido para deseados. el presentado, que se maneja en base a Ofrece un servicio de Logs agentes y consultas mediante el que ayuda en la resolucin de protocolo SNMP, sin necesidad de problemas. conocimientos profundos en Proporciona los grficos de los programacin para confeccionar scripts. servicios relevantes para facilitar El sistema presentado fue diseado e su anlisis. implementado a medida de las Brinda interfaces grficas para necesidades de la empresa y a partir de realizar consultas a la base de una eleccin de diversas herramientas datos de los datos histricos y Open Source, puede ser fcilmente consultas a los dispositivos de interpretado por empleados comunes y los distintos modelos. fcilmente modificado por personal Mejora el tiempo de respuesta experto. frente a un evento. Es posible realizar mejoras y Mejora el desempeo del ampliaciones del sistema. El trabajo operador. futuro puede extenderse a otros tipos de Obtiene mayor satisfaccin del red, mejorar la interfaz grfica e cliente. incorporar nuevas funciones: Permitir al usuario elegir el tipo Srsfield 1611, Crdoba, Argentina, CP 5000, patriciaherrera.ic@gmail.com. de red. Laura Vargas, LaRyC, Facultad de Ciencias Monitorizar y graficar los Exactas, Fsicas y Naturales, Universidad servicios relevantes para las Nacional de Crdoba, Vlez Srsfield 1611, diferentes redes. Crdoba, Argentina, CP 5000, Implementar seguridad. lvargas@efn.uncor.edu. Orlando Micolini, Laboratorio de Arquitectura de Computadoras, Facultad de Ciencias Referencias Exactas, Fsicas y Naturales, Universidad [1] Ovadia, Shlomo. "Broadband Cable TV Nacional de Crdoba, Vlez Srsfield 1611, Access Networks", Ed. Prentice Hall, 5ta Ed, Crdoba, Argentina, CP 5000, 2001. omicolini@compuar.com. [2] CableLabs, "DOCSIS: Documentacin y Especificaciones",http://www.cablemodem.com /primer/, visitada en marzo 2012. [3] MOTOROLA Inc., SURFboard SB5100 Cable-Modem, Gua del Usuario del usuario del cable-mdem, http://broadband.motorola.com /noflash/customer_docs/user_guides/501650- 05-a.pdf, visitada en marzo 2012. [4] Mei Yatco, Joint Application Design/Development, University of Missouri, 1999, http://www.umsl.edu/~sauterv/analysis/ JAD.html. [5] Sommerville, Ian. Ingeniera de software, Ed. Pearson, 7ma Ed, 2005. [6] Weitzenfeld, Alfredo, "Ingeniera de Software Orientada a Objetos con UML, Java e Internet", Ed. Thomson, 3 Ed , 2005. [7] Mauro D., Schmidt K, Essential SNMP, Ed. OReilly, 2nd Edition, 2005. [8] http://www.gentoo.org/, visitada en junio 2012. [9] http://www.apache.org/, visitada en junio 2012. [10] http://www.mysql.com/, visitada en junio 2012. [11] php.net, visitada en junio 2012. [12] http://www.phpmyadmin.net, visitada en junio 2012. [13] Oetiker, T., MRTG Documentation, http://oss.oetiker.ch/mrtg/doc/index.en.html. [14] http://www.gentoo.org/doc/en/cron- guide.xml, visitada en marzo 2012. [15]http://www.gentoo.org/security/en/glsa/glsa- 200503-36.xml, visitada en marzo 2012. [16] Van Jacobson, Craig Leres and Steven McCanne. Tcpdump Linux Man Page. [17] http://www.docsis.org/, visitada en marzo 2012. [18] Freeman, R., "Ingeniera de Sistemas de Telecomunicacin", Ed. Limusa, 1996. [19] Lathi, B. P., "Introduccin a la Teora y Sistemas De Comunicacin", Ed. Limusa, 1996.
Datos de Contacto Patricia Herrera, Laboratorio de Redes y Comunicaciones de Datos, LaRyC, Facultad de Ciencias Exactas, Fsicas y Naturales, Universidad Nacional de Crdoba, Vlez