Вы находитесь на странице: 1из 66

Storage

1 - Introduccin al Storage (almacenamiento)

El aumento del volumen de informacin que circula en las empresas se convirti en un factor crtico en cualquier corporacin, y con l, la importancia de contar con herramientas de almacenamientos de datos creci. Actualmente, el desafo no es slo medir la necesidad de espacio, en funcin de los terabytes a ser preservados, sino administrar ese proceso en forma eficiente para garantizar el acceso rpido e inteligente a los datos almacenados. De ese modo, el concepto de administracin de los datos evoluciona da a da, con el surgimiento de nuevas soluciones, estrategias y tendencias.

Esto se debe a que, antiguamente, la computadora estaba directamente conectada a su sector de almacenamiento, y ninguna otra PC tena acceso a los datos guardados. Las aplicaciones eran ejecutadas en un mainframe. A medida que se desarroll la computacin cliente-servidor, las aplicaciones pasaron a ejecutarse en servidores dedicados, cada cual con su propio sistema de almacenamiento.

A pesar de eso, no tard en surgir la necesidad de que esas aplicaciones compartieran datos. A medida que creca la capacidad de los sistemas de disk array (mdulos de almacenamiento de discos), un nico disk array pudo suplir las necesidades de almacenamiento de varios servidores. As, naci el storage en red. Actualmente, el storage - almacenamiento de datos - va mucho ms all de su concepto. Entre las nuevas modalidades vinculadas al tema estn la virtualizacin de datos y la administracin del ciclo de vida de la informacin, por ejemplo.

Pero qu es la virtualizacin de storage? Tan slo el proceso de consolidar varios dispositivos fsicos, de diversos fabricantes, y reorganizarlos en agrupamientos o clusters virtuales, lgicos o en unidades de almacenamiento. Esas unidades se presentan al sistema operativo (OS) para ser usadas por aplicaciones o por usuarios finales adecuados.

A pesar de sonar como un recurso actual, la virtualizacin del almacenamiento no es una novedad, tanto en su concepto como en la prctica. Definida hace casi 20 aos, en la computacin en mainframes, la tecnologa est consolidndose con el avance de las SANs (Storage Area Networks), que sern tratadas ms detalladamente en los prximos mdulos.

La administracin del ciclo de vida de la informacin o ILM - Information Lifecycle Management permite diagnosticar qu informaciones realmente requieren acceso ms o menos rpido, adems de clasificar el nivel de importancia estratgica de ese dato o informacin para la corporacin. De esa manera, el modelo de almacenamiento puede ser redimensionado, representando un acceso ms inteligente, rpido y a menor costo. Ese concepto se integra a lo que se acord llamar Storage Resource Management (SRM).

Virtualizacin

El almacenamiento de la informacin siempre fue parte de la infraestructura tecnolgica de cualquier empresa o de cualquier usuario. Almacenar informacin es fundamental en el entorno tecnolgico, independientemente de la arquitectura utilizada. Ante la falta de un modelo de estandarizacin en el rea de storage, las empresas invirtieron, a lo largo del tiempo, en islas de storage con diversas marcas para soportar diferentes aplicaciones. Hoy, se observa una verdadera Torre de Babel en ese sector, con sistemas que no se comunican por tener arquitecturas propietarias.

Esa diversidad se da tanto en relacin al uso de recursos fsicos de almacenamiento (como los discos) como a las aplicaciones. En el caso de los discos, esto sucedi principalmente porque fueron adquiridos para soportar una demanda cada vez mayor de almacenamiento en funcin del uso de aplicaciones como Customer Relationship Management (CRM), Enterprise Resource Planning (ERP), Business Intelligence (BI) e inclusive correo electrnico. En cada poca, un

proveedor tena el mejor precio o la mejor tecnologa para complementar esas soluciones.

Actualmente, los discos, transformados en commodities, pueden ser mejor aprovechados y facilitan la composicin de una estrategia de almacenamiento de datos en forma inteligente. La virtualizacin de storage, por ejemplo, garantiza que todos los discos, hasta el momento incomunicables, puedan formar parte de un nico sistema de almacenamiento. De esa forma, la corporacin puede administrar de manera simple los datos almacenados. Adems de esas facilidades, la modernizacin de los recursos para almacenamiento posibilit un ahorro considerable para los usuarios, que ahora pueden utilizar los discos para todas las aplicaciones, con libre eleccin de fabricantes.

As como en el universo de los discos, la virtualizacin contribuye a organizar el modelo de aplicaciones en el rea de almacenamiento. El gran drama que las empresas enfrentaban en el pasado era la falta de interoperabilidad que exista entre las aplicaciones, dado que se presentaban de manera aislada - en cada departamento - y utilizaban software de fabricantes diferentes y muchas veces propietarios.

Eslabn de integracin

Pero la virtualizacin vino a resolver ese problema, transformndose en un eslabn de integracin. Esto se debe a que posibilita que soluciones de diferentes fabricantes puedan dialogar entre s y realizar funciones de aprovisionamiento dinmico. Ese recurso permite que las empresas creen pools de almacenamiento, obteniendo una visin unificada y consolidada de la capacidad total de storage. Por un lado, la tecnologa duplica la capacidad de utilizacin del almacenamiento en las empresas y, por otro, el aprovisionamiento dinmico permite que la asignacin de ms espacio para una aplicacin o servidor se haga automticamente.

Pero no basta con virtualizar, es necesario administrar. Segn el instituto de anlisis Gartner

Group, por cada dlar invertido en la compra de soluciones tecnolgicas, se gastan cinco para controlar y mantener el entorno. Las inversiones en administracin de la informacin son prioritarias para las empresas que adoptan el Storage Resource Management (SRM), lo que permite administrar las diversas plataformas de almacenamiento.

El SRM abarca desde informes para clasificar los datos y polticas de asignacin, hasta la administracin basada en la aplicacin y el control del desempeo. Con la clasificacin de datos, es ms fcil detectar archivos a los que normalmente no se tiene acceso y reubicarlos en otros medios, por ejemplo, para evitar ocupar cientos de gigabytes en dispositivos ms costosos.

Los CIOs (Chief Information Officers), tambin segn el estudio del Gartner Group, sealan que cerca del 40% de las informaciones almacenadas por el usuario final no son interesantes para las empresas. Una buena solucin de SRM, segn los especialistas, incorpora mltiples visiones, as como administra la capacidad fsica y lgica de storage, haciendo que el ambiente de almacenamiento sea mucho ms eficaz. La tendencia es contar con ms servicios de integracin para que los usuarios no tengan que administrar entornos aislados de software de diferentes proveedores.

Con total control

El primer paso para alcanzar la plena capacidad de control es construir una red de almacenamiento inteligente, que permita el acceso al transporte de datos y haga que la informacin se mueva de un lado a otro. Los pasos siguientes son clasificar los datos segn reglas de negocios e iniciar la automatizacin, usando herramientas que faciliten la identificacin de datos y utilizando la red implementada en la primera etapa. Con plataformas de contenido fijo, es necesario que las aplicaciones tengan acceso a ellas, independientemente de que estn en otros soportes o en el disco.

Para tener libre acceso e interoperabilidad global entre las aplicaciones, lo que proporcionar una administracin completa de las informaciones, es necesario construir una red de almacenamiento inteligente. Con un conjunto de software para administracin de storage, es posible identificar las informaciones a las que no se accede y solucionar el problema. Sobre esa estructura se realizan varias evoluciones, como la conexin online entre los storages de produccin y de backup.

A la hora de elegir la mejor solucin, principalmente si la intencin es administrar el entorno de storage, el administrador de la red tendr que unir pedazos. Todava ningn proveedor dispone de una solucin completa, que abarque todos los matices tecnolgicos. Para perfeccionar la administracin, que todos los departamentos de la empresa la comprendan y funcione de una manera lineal, es importante que se implemente una poltica de administracin de los recursos de storage.

As y todo, ella depende de una buena capacidad de negociacin y de un profundo conocimiento de la infraestructura existente y de las necesidades de la empresa. Inclusive porque las informaciones se transforman rpidamente en terabytes, a los que tienen acceso, simultneamente, centenares, cuando no miles de usuarios que crean y acceden a los datos al mismo tiempo y con las ms diferentes finalidades.

Tecnologas emergentes

Con el objetivo de minimizar el caos de la administracin de las informaciones corporativas y, al mismo tiempo, ayudar a las organizaciones a que reduzcan significativamente los gastos de almacenamiento, los proveedores de storage comienzan a brindar soluciones para la nueva onda de ese mercado: la organizacin de las informaciones con base en su importancia para los negocios, en determinado momento.

Los nombres todava varan - algunos proveedores lo llaman jerarquizacin, otros prefieren un

acrnimo de tres letras, ILM (Information Lifecycle Management - gestin del ciclo de vida de la informacin) -, pero el concepto es uno solo. Identificar cada informacin, evaluar su volumen de criticidad para el negocio y la necesidad de acceder rpidamente a ella y, finalmente, rever la infraestructura de storage, para permitir slo la ubicacin de los datos ms importantes en medios de alto rendimiento y, por lo tanto, ms costosos, dejando el resto en equipos ms econmicos. Todo esto hecho de un modo dinmico, automtico y transparente para el usuario.

Entre las tecnologas emergentes en el sector de storage, por lo tanto, estn la virtualizacin, ya citada anteriormente, la Internet SCSI y el ILM (Information Lifecycle Management), junto a tecnologas ya consolidadas como la NAS (Network Attached Storage) - almacenamiento conectado a la red. Las ventajas de su uso incluyen el almacenamiento compartido, la habilidad de adoptar diferentes protocolos de archivos para diferentes entornos y la reduccin de costos administrativos, lo que da como resultado un menor costo total de propiedad.

Por otro lado, la SAN (Storage Area Network), red de almacenamiento, puede utilizarse para conectar mltiples servidores y se recomienda en organizaciones con necesidad de storage de amplia escala y un arsenal complejo de dispositivos de almacenamiento. El ILM, gestin del ciclo de vida de la informacin, es un recurso que contribuye a la administracin de storage en forma inteligente y es fundamental para la demanda actual. Algunos estudios muestran que los datos de la mayora de las aplicaciones no necesariamente necesitan estar disponibles para acceso online, a medida que pasa el tiempo.

Un ejemplo de eso son los mensajes archivados en la casilla de correo electrnico. Normalmente, despus de 45 das de su recepcin, ese mensaje, as como sus adjuntos, no necesitan ocupar espacio en un disco ms rpido y, por consiguiente, ms caro. De ese modo, en caso de que la empresa necesite comprar discos, la adopcin de la administracin de las informaciones permite la adquisicin de discos ms lentos (y ms econmicos), que recibirn automticamente las informaciones utilizadas con menos frecuencia, reduciendo sensiblemente las nuevas inversiones en storage.

Entre los protocolos de comunicacin figuran el FC (Fibre Channel) - una de las tecnologas ms comercializadas para transmisin de datos entre dispositivos informticos, adecuada para conectar a varios servidores informticos a dispositivos de almacenamiento compartido. Y el

flamante iSCSI (Small Computer System Interface) - protocolo emergente que ofrece I/O por Ethernet y redes IP, y que tiene las mismas ventajas que la SAN, pero usa protocolos de networking.

Ese protocolo es actualmente sealado como la tecnologa que ms ayudar al desarrollo del mercado de SAN. El FC/IP (Fibre Channel over IP) - junto al iSCSI, es tambin uno de los principales enfoques de transmisin de datos de almacenamiento a travs de redes IP. Tambin forman parte de este paquete de tecnologas emergentes las soluciones de Disaster Recovery (Recuperacin en caso de Desastres), dado que el almacenamiento ocupa un lugar fundamental en la estrategia de recuperacin de los negocios.

La minimizacin de las perdidas provocadas por un eventual accidente sobre los sistemas de informacin corporativos depende bastante de las opciones estratgicas y de las soluciones adoptadas por la organizacin en el rea de almacenamiento. Las soluciones se centran cada vez ms en la continuidad del negocio y en la preservacin de los sistemas. La velocidad de recuperacin de datos deber ser entendida por toda la estrategia de TI de la corporacin y como elemento central del propio negocio.

2 - Recursos fsicos

No hace mucho tiempo, era posible almacenar datos en simples diskettes. Posteriormente, con la facilidad cada vez mayor de acceso a la informacin, el volumen de datos corporativos creci y se volvi estratgico para el xito de los negocios. De ese modo, el almacenamiento se transform en un procedimiento imprescindible para la gestin y la disponibilidad inteligente de las informaciones dentro de la organizacin. Para esa operacin, sin embargo, son necesarios diversos tipos de medios, es decir, dispositivos de almacenamiento. Pueden dividirse en tres grupos de unidades: magnticas, pticas y pticas y magnticas.

Las cintas magnticas fueron muy tiles a inicios de la dcada del 60, cuando las computadoras se comercializaban como unidades de cassettes. Hoy, a pesar de ser de acceso muy lento, todava se utilizan en algunos casos para hacer el backup de informaciones a las que no es necesario acceder con frecuencia. Las unidades de cinta de cartucho de de pulgada, conocidas como QIC (quarter-inch cartridge), funcionan para hacer backups de muchos discos rgidos.

Las cintas streamer fueron las primeras memorias secundarias, usadas para almacenamiento de backups. La apariencia de ese tipo de cinta magntica es similar a las que se usaban en los

grabadores antiguos. Est hecha de material plstico y cubierta por una sustancia magnetizable. Los datos se graban en los llamados registros fsicos de ese medio. Cada uno de ellos se graba en bandas paralelas, divididas en frames (cuadros). Cada frame es el espacio para almacenar 1 byte. El espacio entre un registro y otro es llamado gap.

Las cintas DAT son la segunda generacin de cintas magnticas. Ms pequeas, ms fciles de almacenar y ms seguras, permiten almacenar mayor cantidad de datos. Su gran capacidad (2 GB a 4 GB) hace que sean ideales para backup de grandes volmenes de datos. Su apariencia es semejante a la de una cinta de video, de menor tamao.

Medios removibles

Los medios que trataremos a continuacin son definidos por muchos como discos rgidos. Pero, a pesar de ello, de manera diferente a otros discos, son removibles y pueden ser transportados. Son tiles para hacer backup o transportar gran cantidad de datos, ya que los diskettes poseen poca capacidad y los discos rgidos no pueden ser transportados. La desventaja es que el acceso es un poco lento.

El Jaz es uno de esos medios. Su capacidad llega a 2 GB y la tasa de transferencia promedio es de 2 MB por segundo. De ese modo, este dispositivo es una buena opcin para hacer backup de discos rgidos y no es muy utilizado para transporte de datos, porque exige una interfaz SCSI (Small Computer System Interface).

Con la necesidad de dispositivos de fcil transporte y con alta capacidad de almacenamiento, los zipdisks y los superdisks, por ejemplo, surgen como una buena opcin, cada vez ms difundida. Existen versiones con capacidad para 100 MB (ms utilizado) y 250 MB (con ms recursos, pero poco difundido).

Y tambin est el viejo y conocido diskette, denominado disco flexible, que fue creado en la dcada del 70 y se volvi el ms popular medio de almacenamiento de datos en pequeas cantidades. Actualmente, con la avalancha de datos, fue reemplazado por otros medios, como, por ejemplo, el CD (Compact Disk).

Los discos rgidos, tambin conocidos como hard-disk (HD) o winchester, estn presentes en prcticamente todas las computadoras y son el medio ms rpido y con mayor espacio para almacenar las informaciones. El HD es un conjunto de discos de aluminio, que utiliza la lectura y la grabacin magnticas. Fabricado dentro de una caja de metal blindada al vaco, posee, como los diskettes, una divisin en bandas y sectores. Cada disco posee dos caras, cada una con su cabezal de lectura/grabacin exclusivo.

Unidades pticas

Una unidad ptica es grabada por medio de un lser de alta potencia. Con el lser, son hacen orificios (pits) en un disco matriz. Las reas no perforadas entre los pits, son los llamados lands (espacios). Como los pits tienen una reflectividad diferente a la de los lands, representa una informacin digital (0 y 1).

Para hacer la lectura de un CD-ROM (Compact Disk Read Only Memory), un lser ubicado en el cabezal de lectura ptica del drive proyecta un haz de luz que penetra en la capa de plstico protectora del disco y choca contra el aluminio reflexivo. Al chocar contra un espacio (land), la luz se refleja nuevamente y es registrada como presencia de luz (bit 1) y las cavidades (pits) que no reflejan la luz son registradas como ausencia de luz (bit 0)

Las unidades pticas, sin embargo, no sufren ninguna modificacin si son expuestas a los medios magnticos. Podemos dividir las unidades pticas en CDs y en DVDs. Los CDs son el tipo ms popular de unidad ptica y muy usados actualmente, principalmente para multimedios. Tienen una capacidad de 650 MB (aproximadamente 500 diskettes), favoreciendo su uso para juegos o instalacin de programas.

El CD-ROM es el tipo de CD que slo sirve para lectura. Ya viene grabado de fbrica y slo se lo utiliza para leer las informaciones que contiene. El CD-R (Compact Disk Recordable) fue creado debido a la necesidad de almacenar grandes cantidades de datos, que no entran en los diskettes. Es virgen y por medio de una grabadora de CDs es posible grabar sus informaciones. Sin embargo, slo puede ser grabado una vez.

Tambin se lo conoce como Worm (Write Once Ready Many) y es muy usado para grabar programas piratas. Una de las actuales y ms utilizadas aplicaciones de los CD-R es la grabacin de informaciones que necesitan guardarse a efectos legales. Esto se debe a que ese recurso no permite la modificacin de su contenido, garantizando la autenticidad de la informacin.

Existe tambin el CD-RW (Compact Disk Rewriteable), semejante al CD-R, pues posee la ventaja de poder ser grabado y regrabado diversas veces. Sin embargo, su costo todava es alto.

Usando el mismo principio de los CDs, el DVD (Digital Versatile Disk) posee una capacidad mucho mayor de almacenamiento, pudiendo llegar a 17 GB y una calidad de grabacin an mejor. Actualmente, el DVD-Rom es muy utilizado para grabar pelculas que pueden verse en la computadora o en un aparato especfico de DVD. Se dividen, siguiendo el mismo principio de los CDs, en DVD-R y DVD-RW.

Las unidades pticas-magnticas son un nuevo tipo de tecnologa para el almacenamiento de datos que puede desbancar inclusive a los CDs - son los MO (Magneto-Optical) disk. Es una tecnologa hbrida que combina los principios magnticos de los discos y los principios pticos de los CDs. Pueden almacenar hasta 2 GB. Esta tecnologa combina grabacin ms confiable y rpida por lser, con la posibilidad de regrabar varias veces los datos en el disco, permitida por la unidad magntica. El tamao de los discos tambin es de aproximadamente 3,5 pulgadas.

Dispositivos fsicos

Entre los medios fsicos disponibles en el mundo del storage, se destacan el Direct Attached Storage (DAS), los discos Redundant Array of Independent Disks (RAID), el ATA (Advanced Technology Attachment) y la arquitectura Blade Server. Y tambin las interfaces iSCSI (Internet Small Computer System Interface) e ISCSI (Small Computer System Interface).

El Direct Attached Storage son drives integrados al gabinete de la computadora conectados a la CPU va PCI u otro perifrico. Es diferente de la NAS (Network Attached Storage) y de la SAN (Storage Area Network), unidades externas conectadas a las workstations y servidores que se ejecutan en red. Con el DAS, cada servidor est dedicado al storage.

Para que quede claro, cabe definir en forma sinttica al NAS como el almacenamiento conectado a la red que brinda acceso a archivos a los usuarios conectados, utilizando protocolos de transporte en Ethernet y TCP/IP. Las SANs permiten que diversos servidores compartan espacio en disco, a partir de uno o ms disk array (matriz para discos de storage). Las SANs les brindan a los servidores el acceso al almacenamiento en bloque, usando el protocolo Fibre Channel.

En el medio fsico, las interfaces desempaan un papel importantsimo para facilitar o inclusive propiciar la interoperabilidad - integracin armoniosa entre hardware y software de manera de facilitar la comunicacin entre ellos.

En ese contexto tenemos la interfaz iSCSI, ejecutada en redes de protocolo TCP/IP.

Una pequea iSCSI puede construirse en la cima de las redes existentes y usar inclusive el Windows o servidores Linux como arrays remotos de almacenamiento. Las grandes redes tambin pueden beneficiarse de este recurso, siempre y cuando la iSCSI haga que los costos de la SAN sean ms accesibles.

La interfaz de hardware SCSI permite la conexin de hasta 15 perifricos en una misma placa que

se interconecta a la placa madre, usando un PCI (Peripheral Component Interconect interconector de componentes perifricos). Los perifricos SCSI estn interconectados y todos tienen un segundo puerto para la conexin con el prximo equipo en lnea. El host SCSI son adaptadores que tambin estn disponibles con dos controladores, y soporta 30 perifricos.

Qu es el RAID?

Fundamental para los sistemas fsicos de storage, el RAID (Redundant Array of Independent Disks matriz redundante de discos independientes) es un subsistema de disco que brinda tolerancia a fallas. Se trata de una tecnologa que combina varios discos duros (HD) para formar una nica unidad lgica, almacenando los mismos datos en todos (redundancia).

En otras palabras, es un conjunto de HDs que funciona como si fuese uno. Esto permite tener una alta tolerancia contra fallas, pues si un disco tiene problemas, los dems continan funcionando, dejando los datos disponibles. El RAID surgi hace ms de 15 aos, como resultado de investigaciones realizadas en la Universidad de Berkeley, en California, Estados Unidos.

Para formar el RAID, es necesario utilizar, por lo menos, 2 HDs. El sistema operativo, en ese caso, visualizar los discos como una unidad lgica nica. Al grabarse los datos, se reparten entre los discos del RAID (dependiendo del nivel). De esta forma, adems de garantizar la disponibilidad de los datos en caso de falla de un disco, tambin es posible equilibrar el acceso a las informaciones, de forma que no se produzcan cuellos de botella.

Adems del RAID, el ATA (Advanced Technology Attachment) es considerado uno de los discos ms econmicos del mercado. Es el nombre oficial que un grupo del American National Standard Institute utiliza para lo que la industria informtica llama electrnica integrada del drive (IDE integrated drive electronics).

Las opciones, dependiendo del perfil del cliente, tambin pasan por las NAS. Las ventajas de su uso incluyen el almacenamiento compartido, la habilidad de adoptar diferentes protocolos de archivos para diferentes entornos de usuarios y la reduccin de costos administrativos, resultando en un menor costo total de propiedad.

Blade Server - Otro recurso fsico bastante usado en centros de datos son los Blade Servers. Es una arquitectura de mltiples servidores en un nico chasis, que economiza espacio y mejora la administracin. En rack o en gabinetes individuales, los chasis permiten un mejor soporte. Cada blade tiene su propia CPU, memoria y disco rgido, permitiendo tambin buenos recursos de redundancia.

La industria est ofreciendo cada vez ms servidores blade. La participacin de ese segmento de servidores en el mercado creci ms del doble en 2004, alcanzando las 450 mil unidades, 7% del mercado, con predicciones de llegar al 40% antes de 2006, segn el instituto de investigacin IDC. El rpido avance de los sistemas de gestin, de la tecnologa de cluster y la continua disgregacin de los servidores en pequeos equipos y componentes permite predecir el crecimiento de los servidores blade y de los sistemas modulares.

Protocolos - Para que los datos pasen o sean transmitidos de un medio a otro, es decir, transiten, necesitan interfaces, que ya fueron abordadas, y tambin protocolos. Por lo tanto, su almacenamiento en los medios fsicos deber contar con la participacin de protocolos como IP, Fibre Channel, Gigabit Ethernet, entre otros.

Con la popularizacin del protocolo Fibre Channel, productos como SAN y NAS crecieron en aceptacin entre los administradores de TI, porque ofrecen mejor rendimiento y almacenamiento, adems de mayor escalabilidad, haciendo que los productos DAS pierdan presencia en el mercado. Mientras que en 1998 el DAS tena un 88% de participacin, el ao pasado ese porcentaje cay al 56%, de acuerdo con IDC. Para antes de 2006, los especialistas predicen una disminucin al 26%.

El protocolo Fibre Channel es una de las tecnologas ms comercializadas para transmisin de datos entre dispositivos informticos, adecuada para conectar servidores informticos a dispositivos de almacenamiento compartido. Es el protocolo de alta velocidad usado para desarrollar las llamadas SANs. Aunque pueda usarse generalmente en red, cargando ATM, IP y otros protocolos, el FC inicialmente soportaba el trfico de datos SCSI de los servidores a los disk arrays, con comandos en serie.

Actualmente, el FC slo soporta conexiones de fibra nica y multimodal, adems de cable coaxial. Puede configurarse punto a punto, va switch, con o sin hub y conectarse hasta a 127 nudos. Puede transmitir hasta 2,12 GB en cada direccin y usa el protocolo Gigabit Ethernet. El FC est evolucionando hacia el FC/IP (Fibre Channel over IP) que, junto al iSCSI, es tambin uno de los principales enfoques de transmisin de datos de almacenamiento a travs de redes IP.

El protocolo IP Storage - El IP Storage puede usarse para desarrollar una SAN, junto con el Gigabit Ethernet. Tradicionalmente, las SANs eran desarrolladas usando el transporte Fibre Channel porque ese procedimiento brindaba velocidad a los gigabits comparados de 10 Mbps Ethernet a 100 Mbps Ethernet, usados para construir redes de mensajes. Los equipos con FC son ms caros y la interoperabilidad entre diferentes proveedores no est totalmente estandarizada.

El IP se volvi ms comn y, en consecuencia, el entorno IP Storage se populariz en SANs, extendiendo la tecnologa. Las SANs se consolidaron como una tecnologa prometedora, simple y de fcil administracin en un gran y complejo sistema de storage. Pero tiene un alto costo: la

primera generacin de SANs depende de redes FC, que requieren nuevos cables, aprender nuevas herramientas y switches especializados. Desgraciadamente, esto hizo que las SANs fueran difciles de justificar, a no ser para las grandes instalaciones de storage.

3 - Virtualizacin

La virtualizacin de storage - almacenamiento en red, de forma tal que los datos guardados puedan compartirse - es un concepto usado para definir una infraestructura inteligente. En ella, diversos dispositivos, con caractersticas, funcionalidades, rendimiento, niveles de servicio e inclusive medios fsicos diferenciados se presentan al servidor y a las aplicaciones como si fueran virtuales. De ese modo, se simplifica la administracin y se disminuye la complejidad de ubicacin y de configuracin.

Esa modalidad no es ms que el proceso que permite consolidar varios dispositivos fsicos de diversos fabricantes y reorganizarlos en agrupamientos virtuales, lgicos o en unidades de almacenamiento. Esas unidades se presentan al sistema operativo (SO) para ser usadas por aplicaciones o por usuarios finales determinados. A pesar del creciente inters en la virtualizacin del almacenamiento, el concepto no es nuevo. Definido hace casi 20 aos, en la computacin de los mainframes, la tecnologa est descubriendo una nueva oportunidad e importancia con el surgimiento de las SANs (Storage Area Networks), dispositivos de almacenamiento de datos en red.

El sector es tan importante en el mercado de storage que, en 2007, dos grandes empresas anunciaron inversiones en esta tecnologa: Sun Microsystems y Dell. Sun anunci su ingreso al mercado de virtualizacin a fines de 2007 con la plataforma llamada xVM, compuesta inicialmente por un servidor y por el sistema de administracin Ops Center. Dell apost a la compra de EqualLogic, proveedora de storage area network (SAN), por USD 1,4 mil millones en noviembre de 2007. La compra es considerada un impulso a los esfuerzos de Dell para brindar virtualizacin a sus clientes.

La virtualizacin permite usar la infraestructura, disminuyendo su ociosidad y posibilitando la implementacin de la Information Lifecycle Management (ILM) en todas las aplicaciones, independientemente de la infraestructura. Hay algunos requisitos esenciales para su implementacin: escalabilidad, administracin punto a punto, interoperabilidad, adhesin a los

estndares de la industria y la tan soada reduccin del costo total de almacenamiento, proporcionando un ahorro real en comparacin con las soluciones existentes.

Adems de compartir las SANs, los beneficios de la virtualizacin tambin se advierten en la arquitectura de almacenamiento de dispositivos conectados fuera de la red Direct Attached Storage (DAS). Sea en mainframe o en entornos de sistema abierto, las tecnologas de virtualizacin son utilizadas para simplificar y centralizar la administracin y ofrecer flexibilidad en la satisfaccin de los requerimientos de acceso a los datos, donde sea que estn.

Este recurso elimina las restricciones fsicas, al crear una capa por encima del almacenamiento fsico, accesible como un agrupamiento lgico de storage y que puede ser ubicado cuando y donde sea necesario. Esta capa brinda la capacidad de combinar dispositivos fsicos heterogneos en entidades virtuales proyectadas para cumplir con los requisitos individuales de las aplicaciones.

Por ejemplo, un agrupamiento virtual de almacenamiento puede ser creado utilizando los discos fsicos ms rpidos, para optimizar el desempeo de una aplicacin de misin crtica, sin modificar la implementacin del hardware. A medida que surge nuevo hardware o que las caractersticas de la aplicacin se modifican, las modificaciones en la capa fsica pueden realizarse sin interrumpir el acceso a los datos en el dispositivo lgico. Las tecnologas de virtualizacin de almacenamiento estn evolucionando, incluyendo soluciones de banda interna y externa (in-band y out-band), basadas en storage y hosting.

Soluciones de almacenamiento y hosting

Las soluciones basadas en almacenamiento fueron las primeras tecnologas de virtualizacin y permiten que varios servidores compartan el acceso a datos en un nico (y gran) array (matriz) individual. El lado negativo es que esos servidores no tienen acceso a los datos ms all de su

propio array. Adems, los usuarios corren el riesgo de quedar limitados a soluciones que dependen de los fabricantes, basados en las restricciones de compatibilidad de hardware del array ms amplio o de los servidores directamente conectados. La virtualizacin basada en el almacenamiento puede, entonces, ser ms cara que otras alternativas.

Las soluciones basadas en hosting permiten que los discos dentro de varios arrays, y de diversos fabricantes, sean representados como un agrupamiento virtual para un nico servidor host. Esto permite que los profesionales de la tecnologa de la informacin, por ejemplo, tengan ms flexibilidad para habilitarlos independientemente de los fabricantes de soluciones de almacenamiento, aunque todava disfruten de los beneficios de la administracin de storage centralizada a partir de una sola consola.

Aunque los datos estn concentrados para que su acceso se d a travs de un nico servidor, este servidor puede ofrecer gran disponibilidad, garantizando que los datos se utilicen. La desventaja surge cuando varios servidores exigen el acceso compartido a los mismos datos. En ese caso, la duplicacin de datos u otros mtodos de virtualizacin de almacenamiento pueden dificultar la aplicacin.

Un desafo en la evolucin de la virtualizacin del almacenamiento era garantizar que los discos de varios arrays y de diversos fabricantes fueran representados virtualmente para ms de un servidor. Esa posibilidad, sin embargo, se obtiene con una solucin de banda interna (in-band) llamada virtualizacin simtrica. As como las soluciones basadas en host, este tipo de virtualizacin tambin es independiente del fabricante y puede utilizarse en las SANs y en las redes locales. Sin embargo, en esas circunstancias, es fundamental que el dispositivo de banda interna tenga la escalabilidad suficiente para satisfacer las crecientes exigencias de administracin de aplicaciones y de almacenamiento.

Las soluciones out-of-band brindan la capacidad de virtualizacin simtrica, pero desplazan al dispositivo de almacenamiento hacia fuera del camino de datos. Esta modalidad tambin est mejor posicionada para utilizar la capacidad de conexin rpida de un switch SAN. Pero para lograr estos beneficios, es necesario que el software se ejecute en los propios servidores de aplicaciones, para la comunicacin del dispositivo virtual. Esto puede aumentar el uso de la CPU y har que las actualizaciones de los sistemas operativos sean ms precarias cuando esas

soluciones estn instaladas.

Todas las tecnologas de virtualizacin son tiles, y la eleccin depende del entorno de TI y de los requisitos corporativos especficos del usuario final. Al elegir una solucin, es importante entender el flujo de datos de un usuario, para garantizar la satisfaccin de las actuales necesidades de negocios, mientras se mantiene una capacidad de adaptacin a las nuevas exigencias que surgirn a medida que las tecnologas evoluciones y se modifiquen. Es fundamental que haya una capa de virtualizacin de almacenamiento que brinde compatibilidad, en vez de limitaciones.

Dado que los datos no estn asociados a dispositivos especficos de hardware, la virtualizacin permite un nivel de flexibilidad sin precedentes en el uso de recursos de storage, para satisfacer las exigencias de las aplicaciones y de los usuarios finales. Los dispositivos de almacenamiento virtual no se restringen a las limitaciones de capacidad, velocidad o confiabilidad de los dispositivos fsicos que los incluyen. La aplicacin de software de almacenamiento inteligente en la capa de virtualizacin proporciona un medio de resolver los desafos funcionales de storage, sin comprometer la necesidad de disponibilidad de los datos.

Consiste en otorgarle a los usuarios o a las aplicaciones la cantidad y el mejor tipo de almacenamiento, en el momento adecuado. La virtualizacin hace mucho ms fcil ese proceso. Sumada a la administracin centralizada, permite que se realicen modificaciones en la capa de almacenamiento fsico sin interrumpir el acceso a los datos, para brindar en forma continua la mejor calidad de servicios de almacenamiento en tiempo real. De esa forma, el usuario tiene acceso a los datos con ms rapidez de la que necesita.

Redes virtuales

Uno de los beneficios de la tecnologa iSCSI (internet small computer system interface) es usar un protocolo emergente que ofrece I/O por Ethernet y redes IP con las mismas ventajas de la SAN,

que usa protocolos de la infraestructura de red. A pesar de eso, ese beneficio es fcilmente superado. Si la red tiene switches gigabit de reserva, el beneficio de la iSCSI es inmediato. Pero muchas redes estn sobredimensionadas, involucrando la interfaz SCSI y el transporte de grandes cantidades de datos. El cliente no necesitar ocupar mucho en upgrades para administrar el trfico adicional.

El uso de la infraestructura existente es muy importante. Hacer upgrade de una red es menos costoso que desarrollar una y hace que una SAN valga la pena para una pequea red para la que no se justifica pagar el alto precio del Fibre Channel (FC). El mercado va a rebajar los costos de la iSCSI, al punto de reemplazar a las FC en la tecnologa SAN. La tendencia es que los fabricantes ofrezcan servidores con bandas para la tecnologa Isasi, as como lo hicieron con FC, ofreciendo 1 U y servidores blade integrados con puertos iSCSI.

Un servidor departamental puede contar con slo un link de 100 Mbps Ethernet para el storage y el trfico de aplicaciones, pero un servidor de base de datos puede fcilmente requerir una conexin Gigabit Ethernet slo para el trfico de storage. Y si hay muchos de esos servidores, el costo de la iSCSI puede acercarse al de la FC. Una red IP y Ethernet, por lo tanto, tiene la ventaja de ser reutilizada si en el futuro el proyecto de SAN es abandonado. Los costos pueden ser todava ms altos si el trfico de storage queda sobre la WAN (red que interconecta dispositivos en sitios remotos). Sin embargo, la iSCSI tambin integra las dos alternativas.

La virtualizacin puede ejecutarse en bloques o en niveles de archivo. En las redes de storage, los bloques se asocian a las SANs Fibre Channel y los archivos de storage a las Network-Attached Storage (NAS). En una tpica virtualizacin en bloque, los datos son mapeados en uno o ms discos. El bloque requerido puede distribuirse en mltiples arrays de storage, pero para el usuario parece residir en un nico drive.

En la virtualizacin de archivo, mltiples objetos pueden parecer un solo archivo. Ese tipo de virtualizacin brinda un nivel de abstraccin entre los archivos y su localizacin fsica. En ese enfoque, se crea un espacio comn, que permite que el usuario tenga acceso a diferentes archivos sin modificar el nombre de su raz. El nombre del espacio de archivo se le presenta al usuario como un nico y gran archivo de sistema.

El archivo tambin puede virtualizarse. Cuando se aplica a la estructura de bloques de storage, es convertido en objetos o archivos. Estos pueden residir en servidores o en sistemas NAS (Network Attached Storage). La virtualizacin de sistemas de archivo y el metadato de los sistemas de archivo individual pueden combinarse para formar una extensin virtual de ese sistema.

En el caso del NAS, los usuarios pueden tener acceso a archivos, en primer lugar usando los protocolos Network File System (NFS) y Common Internet File System (CIFS) sin estar familiarizados con los aspectos fsicos o lgicos de la infraestructura. Idealmente, el sistema de archivo distribuido debe ser capaz de esparcirse por mltiples dispositivos NAS, permitiendo escalabilidad y que los usuarios tengan fcil acceso a los datos, independientemente de dnde estn. Esa es la esencia de la virtualizacin.

Desafos lgicos

La virtualizacin tambin puede ser implementada en diferentes dispositivos, como arrays, usando software de virtualizacin residente en este dispositivo. Ese software permite el desarrollo de pools de storage en mltiples arrays.

Con el storage basado en la virtualizacin, las unidades lgicas son mapeadas en los dispositivos fsicos va algoritmos o usando un enfoque basado en tablas. Bsicamente, los volmenes se independizan de los dispositivos en los cuales residen. Dependiendo de la solucin utilizada, el storage basado en la virtualizacin puede incluir RAID, espejamiento disco a disco y replicacin de datos.

Mientras el rea de storage basado en virtualizacin produce buenos resultados para los proveedores de disk array, adems de ser relativamente fcil de administrar, los sistemas con ese enfoque todava son tpicamente propietarios y limitados en cuanto a la interoperabilidad entre los proveedores de hardware y de software.

Los dispositivos como la biblioteca de cintas tambin pueden virtualizarse. En la virtualizacin de las cintas, los discos de storage son hechos para parecer drives de cinta. Los discos tpicamente front end de biblioteca de cintas permiten una funcin de cach para otorgar ms rpido acceso a los datos. Cuando los usuarios dejan de utilizar el dato con frecuencia, puede ser movido a otra cinta. Sin embargo, el administrador debe asegurarse de que existe una cantidad suficiente de cintas para almacenar los datos sin comprometer el rendimiento. Algunas soluciones de virtualizacin de cintas tambin se restringen a bibliotecas propietarias.

Mientras la virtualizacin encaja perfectamente en corporaciones que quieren optimizar la utilizacin de storage, impulsar la administracin, proveer y administrar sistemas de almacenamiento y reducir costos, existen algunos obstculos que deben ser superados. El primer obstculo es la inexistencia de estndares para la tecnologa, por la falta de interoperabilidad entre los productos dedicados a la virtualizacin.

La virtualizacin, y lo que ella pueda provocar, todava genera mucha confusin. Los potenciales usuarios se mostraron reticentes a invertir en productos. A pesar de la existencia de mltiples enfoques, la virtualizacin brinda flexibilidad pero tambin puede causar problemas durante su uso si la corporacin elije una solucin que, ms tarde, se vuelve obsoleta. Pero el mercado no tiene dudas de que una verdadera poltica basada en la automatizacin del storage requiere maximizar el uso de la virtualizacin.

Iniciativas de interoperabilidad

Los proveedores de tecnologa se han preocupado por la interoperabilidad. Las iniciativas de EMC, Cisco, Brocade y McData, por ejemplo, apuntan a la implementacin de una infraestructura de virtualizacin escalable, abierta, interoperable y con un costo total menor que una SAN tradicional. El primer paso fue unir a los principales fabricantes de switches de SAN y almacenamiento para que, juntos, desarrollaran un conjunto de interfaces de programacin de aplicaciones - las APIs estndar.

Estas API, todava en estudio, formarn un estndar para todos los switches inteligentes, denominado Fabric Application Interface Standard (FAIS - Estndar para Interfaces de Aplicaciones en RED), y ya cuentan con un comit del American National Standards Institute (ANSI - Instituto Nacional Americano de Normas), el denominado T11.5, parte del subgrupo de comits que desarrollan los estndares para Fibre Channel.

El estndar FAIS comienza por separar el control del procesamiento de la operacin de mapeo/virtualizacin en un equipo denominado CPP - Control Path Processor - o Procesador del Control de Rutas. En el CPP se ejecutan las aplicaciones de almacenamiento, tales como rplicas o copias entre volmenes, migracin de volmenes dinmica y mapeo virtual/fsico/array.

El estndar FAIS est siendo adoptado con soporte para los principales dispositivos de almacenamiento del mercado, de diferentes proveedores (EMC, HDS, HPQ, IBM), para los principales sistemas operativos (Windows, Linux, Solaris, AIX, HP-UX y VMware) y funciona con los switches inteligentes de Cisco, Brocade y McData. Otro aspecto importante del estndar FAIS es que tanto los switches y dispositivos de almacenamiento como las mismas aplicaciones pueden ser de diferentes proveedores y, por ser un estndar basado en una API abierta, la interoperabilidad entre los distintos softwares y hardwares est garantizada.

Para el usuario, esto significa proteccin de su inversin, independencia de proveedor, mltiples alternativas de hardware y software y la posibilidad de implementar la virtualizacin en forma gradual, adecuada a las necesidades de la empresa.

4 - Administracin

Mundialmente, el segmento de software de administracin de storage ha crecido aproximadamente un 14% por ao, segn la International Data Corporation. Pero hay analistas que sealan la falta de cultura, as como problemas con los estndares del mercado y, por consiguiente, fallas de integracin, como obstculos para que el mercado evolucione.

Parte de los gastos es atribuida por la IDC al deseo de las corporaciones de controlar el uso del almacenamiento de los empleados. Adems, las empresas adoptan las soluciones como medio para reducir costos, mejorar la eficiencia y utilizar mejor las herramientas de almacenamiento. Los softwares de administracin de storage permiten simplificar y automatizar redes complejas como las SANs (Storage Area Networks).

A pesar de esto, el mercado brasileo no tiene el hbito de invertir en ese nicho de administracin, priorizando inversiones en otros segmentos. Aun permitiendo una optimizacin de las personas y de la infraestructura, los beneficios no son vistos inmediatamente, por eso el software de administracin de storage muchas veces es dejado en segundo plano. En muchas compaas, los ejecutivos del rea de informtica y los administradores de datos estn enfrentando una explosin de datos en sus redes y la necesidad urgente de administrarlos.

Con un entorno informtico cada vez ms complejo y una situacin econmica y de negocios en constante cambio, las organizaciones de TI estn sobrecargando a sus profesionales. Emplear estructuras de administracin de red de almacenamiento alivia la carga de la interoperabilidad y la complejidad de administrar redes de varios fabricantes.

Maduracin del mercado

Los proveedores como IBM, Veritas, EMC, HP, StorageTek y Computer Associates estn empeados en ofrecer una nica interfaz de administracin para las complejas tareas relacionadas con el control de un creciente nmero de redes de almacenamiento. De esa forma, se disminuye la carga de los administradores, liberando tiempo para que puedan trabajar estratgicamente.

Una estructura de administracin de storage independiente del hardware permite que las organizaciones de TI administren, de manera proactiva, todo su entorno de redes de

almacenamiento. Esas estructuras abstraen la complejidad de los dispositivos ms all de la red y permiten que el administrador se dedique a tareas estratgicas, como aumentar la utilizacin del almacenamiento y mejorar los servicios.

No hace mucho tiempo, las decisiones sobre almacenamiento y operaciones en red eran sencillas. Haba pocas opciones, menos fabricantes y pocas tecnologas para elegir. Actualmente, existen ms fabricantes, ms metodologas de almacenamiento conectadas en red y nuevas tecnologas. Hoy, hay muchos medios para utilizar redes de almacenamiento.

Independientemente del tamao de la empresa, una red de almacenamiento bien construida y bien administrada puede aumentar la eficiencia no slo para la empresa, sino tambin para las organizaciones de TI dentro de la empresa. El concepto de una red de almacenamiento es simple: conectar servidores corporativos a un grupo centralizado de discos, facilitando la administracin, aumentando el desempeo y haciendo que el backup de datos sea ms confiable. Es la llamada virtualizacin de storage, que ya fue tratada anteriormente.

Por ejemplo, una SAN (Storage Area Network) tpica consiste en una red de dispositivos de alto desempeo, ms complejos, que componen la ruta de los datos. Un grupo de dispositivos altamente inteligentes, incluyendo HBAs (adaptadores de bus de host), conmutadores y vectores de almacenamiento componen las actuales redes de almacenamiento. Para controlar esos dispositivos son necesarios los softwares de administracin.

Existen muchos fabricantes que proveen soluciones de NAS (Network Attached Storage) y SAN para las redes de almacenamiento, pero pocos brindan una solucin completa para el control de esos datos, transformando a la interoperabilidad y la efectiva administracin de las redes de almacenamiento en un desafo.

Administracin bsica

Muchos administradores controlan y brindan sus recursos de almacenamiento utilizando planillas e informes de inventario que quedan inmediatamente desactualizados. Una estructura de administracin de red de storage elimina esa tarea manual, descubriendo automticamente las conexiones fsicas y lgicas para la red de almacenamiento, exhibiendo las informaciones en un mapa grfico de topologa y conectando los datos en mltiples informes.

Las redes de almacenamiento son entornos complejos que engloban muchos componentes, incluyendo clientes, servidores de aplicaciones, conmutadores, hubs y dispositivos de almacenamiento. A medida que una red de storage evoluciona y su tamao aumenta, se hace cada vez ms difcil identificar con precisin todos los componentes y las relaciones fsicas entre ellos.

Adems, el mapeo de la visualizacin lgica (almacenamiento virtual) aumenta la complejidad, porque no existe una relacin fsica directa obvia. Para los administradores es crucial disponer de las visualizaciones fsicas y lgicas por medio de una topologa que identifique fcilmente todos los componentes, as como sus relaciones fsicas.

Un recurso importante de cualquier estructura de administracin de almacenamiento es la capacidad de controlar los datos sobre desempeo y los datos histricos en tiempo real, para los parmetros de niveles de servicio, como conectividad, espacio disponible y tiempo de acceso a los datos.

Utilizando inteligentemente todos los recursos de almacenamiento disponibles, los administradores de TI estn en condiciones de tomar decisiones rpidas, elaborando informes integrados a partir del control y de la administracin de recursos. Al hacerlo, pueden monitorear sus entornos y estar preparados para realizar modificaciones instantneamente.

Se dice que una administracin es avanzada cuando permite un control inteligente. Cuando los

administradores se benefician de los recursos de visualizacin y de elaboracin de informes en una estructura de administracin, pueden comenzar a utilizar ms recursos, como seguridad, provisin de almacenamiento y administracin proactivas.

Garantizar que las aplicaciones cuenten con los recursos de almacenamiento necesarios significa brindar storage seguro, desde vectores a dispositivos de backup y hosts dentro de la red de almacenamiento. Una buena estructura avanzada de administracin de storage brinda almacenamiento integrado, dividiendo por zonas desde los vectores de almacenamiento a los hosts, por medio de asistentes fciles de usar.

Los asistentes disminuyen la complejidad y facilitan las tareas de administracin de almacenamiento. Los recursos avanzados tambin deben ofrecer servicios que garanticen una buena calidad de servicio para las aplicaciones ms importantes. Las herramientas permiten que los administradores busquen y asignen el almacenamiento por atributo, proporcionando un control inteligente del entorno.

Asociacin completa

Las estructuras de administracin de redes de almacenamiento permiten que las empresas cuenten con la flexibilidad necesaria para responder a las prioridades de negocios, que estn en constante cambio. Utilizar todos los recursos de una poderosa estructura de administracin de red de storage permite que las organizaciones respondan rpidamente y modifiquen la asignacin de recursos, minimizando el impacto de los costos en los negocios.

Una estructura bsica de administracin debe ofrecerles a los administradores informticos la capacidad de monitorear el rendimiento de sus redes de almacenamiento. Las soluciones de administracin de storage deben efectuar el control activo de los datos, que, a su vez, posibilita que los administradores de TI establezcan polticas de control del desempeo en forma proactiva, en vez de reaccionar frente a los problemas cuando ellos se presentan.

La administracin proactiva favorece la mayor consistencia y eficiencia del servicio. Los administradores generalmente actan de modo reactivo, cuando hay un corte de energa o se rompe un equipo, pudiendo, a veces, no seguir las polticas establecidas.

Una buena estructura de administracin de almacenamiento debe posibilitar que las compaas se adapten a un entorno tecnolgico en constante cambio, proporcionando flexibilidad para adoptar nuevas tecnologas, a medida que aparecen en el mercado. Los sistemas de storage deben estar en condiciones de explotar y de aprovechar las nuevas tecnologas y arquitecturas, sin poner en riesgo los niveles de servicio.

El costo de esas tecnologas no slo se relaciona con el de hardware no se trata del costo de un servidor o de un vector de almacenamiento considerado a partir de diferentes fabricantes o inclusive de una topologa diferente. El componente ms importante en la relacin costo y riesgo es el costo de tener que capacitar nuevamente al personal y de re-equipar con herramientas apropiadas a todos los procesos ya establecidos.

Es fundamental que los gerentes optimicen las fuentes que provocan mayores costos: las personas. Los administradores con alta capacitacin necesitan trabajar estratgicamente para proyectar las mejores prcticas que puedan implementarse de manera consistente en toda la organizacin, a travs de empleados menos habilitados. El nico medio para lograr esto de modo efectivo y eficiente es capacitando aplicaciones proyectadas para reducir la carga y simplificar entornos complejos.

Los clientes quieren que la administracin vaya ms all de las soluciones tradicionales de backup y de recuperacin de datos. Con las aplicaciones de e-business, la planificacin para almacenar informaciones debe contemplar la confiabilidad, escalabilidad y recuperacin de accidentes sin comprometer a la infraestructura.

Tener un efectivo control sobre las informaciones almacenadas, garantizar a los usuarios el acceso a los datos requeridos en un plazo de acuerdo con sus necesidades y, principalmente, reducir significativamente los costos de almacenamiento es la meta de los profesionales que trabajan con storage en las corporaciones.

Ese es el concepto clave que propone el ILM (Information Lifecycle Management) o administracin del ciclo de vida de la informacin. Los usuarios se muestran muy interesados, pero la complejidad de los proyectos y las barreras tecnolgicas todava detienen las iniciativas, que comienzan a surgir tmidamente en el mercado brasileo.

El ILM es una estrategia de storage que prev equilibrar el costo de almacenamiento y administracin de la informacin segn su importancia a travs del tiempo. Un reflejo de esto es el aumento de la bsqueda de soluciones de SRM (Storage Resource Management), uno de los pilares del concepto.

La verdad es que, ya sea por los efectivos beneficios proporcionados por la administracin del ciclo de vida de la informacin o por la insistencia de proveedores y consultores acerca de este tema, es cada vez ms difcil encontrar a un profesional de TI que no est pensando, en algn grado, en el ILM.

Para administrar datos, se utilizan softwares de HSM (Hierarchical Storage Management) y SMS (Storage Management Systems), adems de equipos basados en el concepto de virtualizacin. Esas acciones facilitan la administracin del entorno. La tendencia es administrar todo el storage en forma centralizada, con una visin unificada.

Reduccin de costos

La reduccin de costos es el gran motivo para la posible revolucin causada por el uso de conceptos de ILM, ya que permite utilizar ms espacio que el disponible. Es necesario analizar cuidadosamente las necesidades del cliente para asignarle al dato el medio ms adecuado de almacenamiento, ya que entran en juego diversos aspectos, como el tiempo de respuesta, los softwares de replicacin, la criticidad de la informacin y la arquitectura de la solucin, por ejemplo, segn los especialistas de TI.

Para evitar la duplicacin de informaciones y garantizar la seguridad de los datos es necesario adoptar, por ejemplo, herramientas de automatizacin de backup que permiten la sincronizacin de los sitios remotos con la base de datos principal, copiando solamente las informaciones efectivamente modificadas. Uno de los principales desafos es ofrecerle al usuario la posibilidad de tener acceso a las informaciones cuando las necesita y garantizar que esa informacin sea nica.

Dejando de lado las perspectivas utpicas de analistas o proveedores, queda claro que la propuesta del ILM es vlida e interesante y que contempla algunas de las principales preocupaciones de los usuarios: la optimizacin de las operaciones y la reduccin de costos. Por otro lado, es fcil entender que la propagacin de este tipo de arquitectura de almacenamiento tiene un ritmo mucho ms lento que el previsto por los especialistas y que la inmadurez de la mayor parte de las soluciones todava provoca que los CIOs acten con cautela al emprender una iniciativa de este tipo.

Hoy, el mercado sigue la trayectoria de almacenamiento de contenido no estructurado, como e-mails, pelculas e imgenes. Y los proveedores estn organizndose para acompaar el crecimiento de ese tipo de informacin, tanto en software como en servicios. Esto tambin incluye proveer gestin y estrategias para administrar el ciclo de vida de esos datos por medio del ILM.

Se abren, entonces, ms perspectivas de ventas en segmentos como el sector financiero (ms especficamente los bancos) y la construccin civil. El desafo es guardar las informaciones ms crticas en medios de mayor costo, como discos de alto desempeo y con alta capacidad de recuperacin. Tambin, en otros (ms accesibles) de menor importancia para el cliente. Otra tendencia del sector se encamina hacia la oferta de servicios. La base del ILM es el archivo multicapa y los mltiples dispositivos de almacenamiento que se integran a la tecnologa dando un

tratamiento a los datos segn lo defina el cliente.

Desafos

Una SAN tpica consiste en dispositivos de alto desempeo, aunque complejos, que componen la ruta de los datos. Un grupo de dispositivos altamente inteligentes, incluyendo HBAs (adaptadores de bus de host), conmutadores y vectores de almacenamiento componen las actuales redes de almacenamiento. Y esos dispositivos requieren un alto nivel de administracin.

Existen muchos proveedores de soluciones de NAS y SAN para las redes de almacenamiento, pero ninguno de ellos ofrece una solucin completa de ruta de datos, transformando a la interoperabilidad y a la efectiva administracin de las redes de almacenamiento en un verdadero desafo.

Administrar los recursos disponibles y satisfacer las necesidades de la empresa con un presupuesto cada vez ms acotado son los dos grandes retos de los Chiefs Information Officer (CIOs) en el rea del almacenamiento de datos. La extensa lista de errores cometidos cotidianamente en las estrategias de storage est encabezada por la no utilizacin completa de los recursos existentes y el agregado de nuevos equipos sin un conocimiento cierto de lo que la empresa posee.

El costo de la administracin de la compra del CIO es mayor al valor de la compra en s. Lo central es conocer las necesidades corporativas en vez de invertir en la adquisicin continua de hardware, como es prctica comn en muchas empresas. Por eso es importante administrar los recursos de storage.

El concepto abarca informes para clasificar los datos, polticas de asignacin, automatizacin, anlisis de tendencias y planificacin de capacidad, gestin basada en la aplicacin, control del rendimiento y hasta cobro departamental por el uso de storage.

Es necesario clasificar los dados. Existen archivos a los que no se tiene acceso frecuente y que podran ser traspasados a una cinta, en lugar de ocupar, por ejemplo, 500 GB en disco. Los proveedores recomiendan un anlisis histrico de la empresa para saber cul ser el presupuesto necesario para storage el ao prximo. Otro aspecto que merece ser considerado es la definicin de centros de costos dentro de la empresa.

El cuadro econmico actual agrava la necesidad de racionalizar el uso de recursos. Ese procedimiento es vlido para el rea de storage, cuyo costo puede multiplicarse si los datos se almacenaron indiscriminadamente, sin buscar la mejor opcin para cada caso. En este contexto, preservar lo que ya se hizo es esencial, as como comprobar el retorno de cualquier inversin.

Invertir en la administracin del storage, segn los ejecutivos de TI, es una de las mejores opciones para reducir los costos de almacenamiento. Entre las posibles elecciones estn los sistemas de virtualizacin que permiten que hardwares de diferentes fabricantes coexistan en la misma instalacin, y funciones de aprovisionamiento dinmico, para utilizar los recursos disponibles de acuerdo con las necesidades de la empresa.

La misin de ejecutar una poltica de administracin de storage vara segn la cartera de proveedores de cada compaa. Cuando la empresa le compra a un mismo proveedor la solucin completa, el trabajo es ms fcil. En contrapartida, esa empresa queda atada a una nica solucin y tiene poco margen de maniobra ante la posibilidad de que el proveedor de TI aumente sus precios o salga del mercado.

Si opta por mltiples proveedores, sin embargo, surgen problemas de incompatibilidad. La salida

puede ser adquirir soluciones especializadas de proveedores de software para integrar sistemas heterogneos de storage e instrumentar un punto nico de administracin.

Una visin consolidada y centralizada del entorno de storage es fundamental. Es necesario considerar la relacin costo/beneficio, especialmente para sistemas de backup y recuperacin de datos. El CIO debe considerar dos variables: el tiempo de inactividad de la empresa y el presupuesto disponible.

Por lo tanto, ser una decisin de negocios. Por ese motivo establecer una poltica de administracin de los recursos de storage se convierte en un tem obligatorio en la agenda de las medianas y de las grandes empresas. La era de la improvisacin en almacenamiento de datos comienza a quedar atrs. Otro motivo por el cual los proveedores comienzan a centrarse en los servicios es para ayudar a los clientes a definir estrategias y polticas de storage ms adecuadas para su negocio.

5 - Mercado

El mercado mundial de software para almacenamiento alcanz su 15 trimestre consecutivo de crecimiento, llegando a los USD 2,8 mil millones en el perodo concluido en junio de 2007. Segn una encuesta de IDC, el resultado representa un aumento del 10,4% en ese ao. Entre las reas en expansin constatadas por IDC estn tambin las relacionadas a compliance, legislacin, y HSM - hierarchical storage management -, esta ltima con un aumento del 14,9%.

La empresa lder del mercado en este perodo fue EMC, con ganancias de USD 685 millones y 24,6% de participacin. En trminos de facturacin, la empresa present un aumento del 4,8%, pero en participacin de mercado registr una baja de 1,4%.

El segundo puesto en ese mercado fue para Symantec, con USD 488 millones en ganancias y 17,5% de participacin. IBM ocup el tercer lugar, con USD 362 millones en facturacin y 13% del mercado. Network Appliance, Hewlett-Packard y CA ocuparon los puestos siguientes, con 10,7%,

4,7% y 4,6% del mercado, respectivamente.

La presin en el rea regulatoria, la exigencia del almacenamiento de datos y documentos con fines legales, los planes de contingencia y la popularizacin de los multimedios son algunos de los segmentos que impulsan las inversiones en storage. La primera ola del mercado de almacenamiento de datos fue independizar al storage del servidor y hacer adquisiciones por separado, momento en el que surge el Fiber Channel. Hoy, la tendencia es el uso de redes de almacenamiento de datos ms abierto e inteligente, con SAN (Storage Area Network) y NAS (Network Attached Storage), aunque apoyadas en softwares para adecuarse mejor a la arquitectura. Actualmente, los sistemas de archivos pueden distribuirse por las SANs y por mltiples mquinas, controladas por un servidor.

SAN sistemas de almacenamiento en red es el segmento ms caliente del mercado, segn Info-Tech. Con la cada de los precios de los productos, que se estn transformando en commodities, esa tecnologa se vuelve ms accesible para las medianas empresas. Por eso, proveedores como IBM, HP y EMC, as como las nuevas LeftHand Network, Compellent Technologies e Intransa ya ofrecen productos para las medianas empresas enfocando esa tecnologa. La SAN puede definirse como una red de alta velocidad, comparada a la LAN (Local Area Network), que permite establecer conexiones directas entre los dispositivos de almacenamiento y los procesadores (servidores) centralizados a la distancia soportada por las fibras pticas. La SAN puede considerarse una extensin del concepto de compartir dispositivos de almacenamiento entre servidores e interconectados entre s. (Una SAN puede compartirse entre servidores o dedicada a un servidor local o remoto).

Otra fuerte tendencia del mercado es aliar el storage a la seguridad. La adquisicin de Veritas por Symantec comprueba que existe una interseccin entre las reas de seguridad y almacenamiento en las empresas. La adquisicin moviliz USD 13,5 mil millones. Para Symantec, la estrategia, adems de combinar seguridad y storage, es expandir sus negocios y su presencia geogrfica.

Concentracin en las pequeas y medianas empresas

Los proveedores de storage descubrieron a las pequeas y medianas empresas. Tecnologas que antes slo estaban disponibles para grandes instalaciones de almacenamiento, encuentran ahora su equivalente para las compaas de ese nicho de mercado. Organizaciones como Brocade y EMC orientan sus esfuerzos hacia ese pblico. Para continuar en su ritmo de crecimiento en Brasil, Brocade, proveedora de la plataforma SAN, prev ofrecer soluciones menores para pequeas y medianas empresas, con equipos de hasta 16 puertos.

Otra estrategia es aliar la venta de storage a la comercializacin de servidores Blade. En el sector de telecomunicaciones, que es una de las reas en las cuales Brocade se propone ampliar sus negocios, la base de clientes cuenta con nombres como Vivo, Brasil Telecom, TIM y Telefnica Empresas.

La estrategia de EMC para el segmento de pequeas y medianas empresas fue el lanzamiento de los paquetes Express Solutions, que prometen fcil implementacin y flexibilidad para el crecimiento. Los lanzamientos forman parte del concepto "Simplificando el Storage", que abarca una gama de sistemas, software y servicios. Las nuevas soluciones incluyen productos para almacenamiento en red, backup y recuperacin de datos, archiving, y proteccin de los negocios, con backup remoto de datos.

En el segmento de discos, la capacidad de almacenamiento no deja de crecer. Para atender al mercado de grandes repositorios de datos, Hitachi Global Storage Technologies comenz a vender a fines del ao pasado un disco rgido de 1Terabyte (TB) para PCs. La nueva tecnologa, segn la empresa, se basa en el mtodo de grabacin perpendicular de datos, una manera de almacenar y organizar informaciones dentro del disco rgido, haciendo que cada partcula ocupe un rea cada vez menor del disco.

Crece la necesidad de ms espacio de almacenamiento para video y msica digital y los fabricantes estn cada vez ms atentos a ese mercado. Toshiba tambin anunci lanzamientos basados en la grabacin perpendicular. Ya estaba previsto para el segundo trimestre de 2005 la llegada de drives de 40GB. Los drives son similares a los que hoy se utilizan en el iPod y en dispositivos que reproducen msica digital.

Tanto el fabricante de productos electrnicos Seagate Technology como su competidora Hitachi Global Storage (HGST) ofrecen discos rgidos (HD) de slo 2,5 centmetros de dimetro, capaces de almacenar 6 GB. Seagate tambin ofrece modelos con un dimetro de 2,5 con capacidades menores: 2,5 GB y 5 GB. Hitachi ofrece un aumento del 50% en la capacidad de almacenamiento con respecto al modelo que comercializaba anteriormente.

Para tener una idea de precios, en el mercado internacional, Hitachi comercializa ese producto a USD 299, 40% menos que cuando se lanz el HD de 4 GB. El nuevo producto tiene dimensiones menores porque aloja datos en forma ms compacta en la superficie del disco, con una densidad de 78 GB por pulgada cuadrada, contra los 56,5 GB por pulgada cuadrada del modelo anterior. Los discos de dimensiones reducidas se destinan a pequeos dispositivos, como players de msica digital, en los que 6 GB de archivos MP3 pueden almacenar cerca de 150 horas, o tres mil canciones.

De acuerdo con IDC, tan slo las soluciones de almacenamiento que usan la tecnologa de conexin iSCSI famosa por ser ms barata y de ms simple instalacin, centro de la atencin de SMB movern 6 mil millones de dlares en 2011 en todo el mundo, contra los 600 millones de dlares generados por el sector en 2006.

Actualmente, los clientes exigen que la administracin vaya ms all de las tradicionales soluciones de backup y recuperacin de datos. La informacin es la moneda de la economa del e-business, y la planificacin para almacenar esos datos debe contemplar la confiabilidad, la escalabilidad de la solucin y la planificacin y recuperacin de accidentes.

Para simplificar la gestin de sus usuarios, StorageTek lanz los discos de almacenamiento D-Series y BladeStore/B-Series en el estndar SMI-S v1.0.2 (Storage Management Initiative Specification). El SMI-S fue desarrollado por SNIA (Storage Networking Industry Association), para ayudar a los usuarios finales a reducir la complejidad, los costos administrativos y los desafos de interoperabilidad en la implementacin y en la administracin de entornos de almacenamiento.

Las soluciones de discos secundarios de almacenamiento fueron desarrolladas en alianza con LSI Logic Storage Systems, y las soluciones de discos primarios fueron recientemente aprobadas en el programa de tests de conformidad con SNIA (CTP Conformance Testing Program) para conquistar la certificacin SMI-S.

Tambin en el segmento de discos externos, IBM lanz el dispositivo de disco IBM TotalStorage DS8000 y su versin "baby", IBM TotalStorage DS6000. Su arquitectura permite el direccionamiento de hasta 96 Petabytes (PB), capacidad suficiente para almacenar 2,4 mil veces toda la literatura del Congreso Norteamericano. En procesamiento, alcanza ms de 3 millones de operaciones por segundo (IOPs).

Tecnologa Worm

Ya quedaron muy atrs los tiempos en que IBM anunci su primer drive de cinta magntica en 1950, lanzando el concepto de almacenamiento de datos en el mercado. A pesar de los discos, las cintas continan firmes hasta hoy, creciendo exponencialmente en capacidad y superando lmites.

StorageTek anunci la ampliacin de su cartera de soluciones de tape drives. Entre las innovaciones est la unidad de cinta T9840C, que agrega una interfaz FICON nativa con conectividad y alto desempeo en entornos MVS. El lanzamiento es una evolucin de la familia de soluciones de la empresa, que hoy cuenta con una base de ms de mil productos instalados en Brasil con T9840.

Segn la empresa, el producto promete mayor economa para el almacenamiento de datos crticos y para el acceso a informaciones en entornos z/OS (MVS). La solucin cuenta con un tiempo promedio de acceso a datos de 12 segundos con throughput de datos a 30 MB por segundo para backup y 40 GB de capacidad por cartucho (descompactado). El T9840C tambin

viene con una herramienta Worm (Write-Once-Read-Many), diseada para cumplir con las exigencias de reglamentacin referentes a almacenamiento de datos electrnicos. Inclusive porque se trata de un medio que no permite regrabacin, manteniendo, por lo tanto, la integridad de los datos que contiene.

Quien tambin apuesta al Worm es IBM, que incluy la tecnologa en la unidad de cintas modelo 3592. La nueva tecnologa posibilita el almacenamiento de grandes cantidades de registros electrnicos, con seguridad, por un largo tiempo, con el objetivo de cumplir los requisitos regulatorios y de auditora interna. Los nuevos cartuchos de cinta con tecnologa Worm para IBM TotalStorage estn orientados a clientes que necesitan almacenar grandes volmenes de datos por largo tiempo y debe garantizar la integridad y disponibilidad de esas informaciones.

La integradora Unitech, que representa a la proveedora de soluciones de storage Adic en Brasil, lanza la tercera generacin de unidades de cinta Ultrium, llamada Linear Tape-Open (LTO). Entre las caractersticas destacadas de la nueva solucin estn las capacidades de almacenamiento de hasta 10 Pentabytes (PB), como tambin la transferencia de informaciones con una velocidad de hasta 50 TB por hora.

La familia de bibliotecas LTO-3 incorpora recursos inteligentes para automatizacin de cintas, bibliotecas compactas para grupos de trabajo y funciones de consolidacin de backup corporativo y plataformas multirobticas. Adems, realiza una verificacin proactiva de la ruta, administra la conectividad SAN, puede ser expandida segn la demanda y permite disminuir en casi el 50% la necesidad de llamados de servicio.

Fusiones y asociaciones

La adquisicin de Veritas Software por Symantec por USD 13,5 mil millones fortalece la direccin de Symantec para la oferta de un grupo "holstico" de productos, integrando soluciones de

seguridad y backup de datos. La fusin moviliz al mercado de storage, y no es para menos, ya que el negocio involucra a una de las mayores empresas de seguridad del mundo, absorbiendo a otra de igual representatividad en su sector de actuacin.

Segn IDC, el mercado de seguridad es, de lejos, el ms promisorio en todo el sector de TI, apareciendo como prioridad de inversiones en todas las investigaciones de mercado. Para el instituto, las empresas tienden a invertir en soluciones completas, en lugar de apostar a productos especficos.

Esto modificar el escenario de la demanda y oferta de hardware y software de infraestructura en Latinoamrica. De acuerdo con los analistas, la demanda ya no se restringir a soluciones contra virus y hackers, sino que contemplar entornos que incluyen hardware y software de storage y de administracin de sistemas.

Para el lanzamiento de productos en el rea de SANs tambin se anunci una serie de asociaciones. Brocade, especializada en infraestructura para redes SAN (Storage Area Network), y EMC anunciaron el lanzamiento del EMC Connectrix DS-4100B. De acuerdo con las asociaciones, los diferenciales del producto son la tasa de transferencia de datos de 4 GB por segundo y la escalabilidad de puertos a pedido, proteccin sobre la inversin y compatibilidad con entornos de storage preexistentes.

Basado en la familia SilkWorm 4100 de switches de Brocade, el Connectrix DS-4100B ofrece flexibilidad a las medianas empresas, en las cuales puede actuar como switch del ncleo, o a grandes empresas, siendo capaz de transferir los datos de los extremos a un director SAN mayor.

Para ofrecer una cartera ms completa, IBM anunci una sociedad con Network Appliance a travs de la cual Big Blue revende la lnea de Network Appliance de productos de storage, compitiendo con EMC. NetApp utilizar el software Tivoli, de IBM, para la administracin de

almacenamiento y recomendar los sistemas de cinta de IBM a sus clientes. IBM tambin comercializar la lnea completa de NetApp.

Sun Microsystems tambin es una importante proveedora del segmento. Anunci el Sun StorEdge Enterprise Storage Manager (ESM), software para administracin integrada de Storage Area Network (SAN), desarrollado para ayudar a los clientes a disminuir el costo total de propiedad (TCO) del sistema de almacenamiento.

La gran apuesta del mercado de storage es la posibilidad de administrar el entorno de almacenamiento virtualmente. Con la virtualizacin, los clientes pueden crear "pools" de almacenamiento entre sistemas de diferentes fabricantes, proporcionando una visin unificada y consolidada de la capacidad total de storage.

Actualmente, las empresas tienen que administrar su capacidad de almacenamiento dentro de cada sistema, lo que impide el aprovechamiento del espacio libre en los diferentes discos de storage. La ausencia de una administracin global de almacenamiento genera costosos movimientos de datos y la prdida de tiempo e inversiones.

Con la atencin puesta en ese mercado, IBM est ofreciendo a nivel mundial nuevas versiones de su software de virtualizacin del entorno de almacenamiento, el IBM TotalStorage SAN Volume Controller. La novedad es que el producto soporta mayor variedad de dispositivos de almacenamiento de otros proveedores, como EMC, incluyendo el Symmetrix y el CLARiiON y HDS, y ya est disponible en la web para upgrades de los usuarios actuales.

Hitachi Data Systems Corporation ofrece soporte a la virtualizacin del Hitachi TagmaStore Universal Storage Platform para los sistemas de storage EMC Symmetrix series DMX 800, 1000, 2000, 3000 y Symmetrix 3000, 5000 y 8000. Los sistemas de storage EMC CLARiiON serie CX tambin sern soportados.

La ventaja, segn las compaas, es que ahora los clientes EMC pueden aprovechar el Universal Storage Platform, que aumenta la vida til de los equipos de almacenamiento instalados, reduce los costos operativos y de licenciamiento de software y ofrece una funcionalidad superior de software, como la copia remota asincrnica y la particin lgica, un recurso que no existe en los productos EMC.

La solucin de virtualizacin de la compaa se basa en un controlador, no depende de compatibilizacin entre las APIs de los fabricantes de switch y sistemas de storage y mucho menos de appliances o routers para encauzar los datos. Hitachi extendi los recursos internos de virtualizacin desarrollados durante los ltimos doce aos al storage externo, aprovechando el concepto de puertos de storage virtual. Desde el anuncio del Universal Storage Platform, en septiembre de 2004, Hitachi Data Systems realiz pruebas de virtualizacin con diversos sistemas de storage de las marcas HP, IBM, Sun y EMC.

Una de las soluciones de Veritas para virtualizacin se llama Storage Foundation for Windows, un software de administracin y virtualizacin que se integra a las plataformas Windows para administrar con flexibilidad y en forma simple el almacenamiento de datos en estos entornos. El Veritas Storage Foundation 4.0 for Windows incluye la administracin y la virtualizacin de volmenes, adems de agregar funcionalidades al Windows Server y al Windows Storage Server.

Para ese mercado, HP anunci la profundizacin de su alianza con Veritas, proveedora preferida de soluciones de administracin de volmenes y sistemas de archivos para entornos de alta disponibilidad HP-UX 11i.

Storage online

Para IDC, el backup online se transform en un enfoque atractivo para muchos consumidores, con la llegada de la banda ancha ms econmica, el mayor nivel de comodidad para los usuarios y la

creciente necesidad de proteccin de datos remotos.

La consultora estima que la ganancia para el mercado emergente de storage online alcanzar los 715 millones de dlares antes de 2011, representando el 33,3% de crecimiento entre 2006 y 2011. Cerca de la mitad de los gastos de este mercado sern realizados primero en Norteamrica, pero otras regiones aumentarn su participacin antes de 2011, segn la compaa. IDC tambin prev que la adopcin de consumidores y pequeos comerciantes dominar el mercado por varios aos con adopciones lentas por parte de corporaciones medianas y empresas, lo que implicar un lento crecimiento en la facturacin hasta 2010.

Hasta ese momento, para la consultora, las prcticas de servicios comenzarn a estandarizarse, la competencia frenar el aumento de precios, los proveedores se consolidarn y los backups online se transformarn en una caracterstica comn en algunos servicios online. La consultora dice que el almacenamiento online inicia su transformacin hacia una opcin de backup simplificada para consumidores y pequeos negocios, y hacia una oferta de capacitacin de grandes empresas en operaciones de disaster recovery, reglamentaciones de compliance y reduccin de costos de infraestructura de almacenamiento.

6 - Implementacin

Al principio, una computadora se conectaba directamente a su sector de almacenamiento, y ninguna otra computadora tena acceso a los datos guardados en ella. Las aplicaciones se ejecutaban en un mainframe. A medida que la computacin cliente-servidor se desarroll, las aplicaciones comenzaron a ser ejecutadas en servidores dedicados, cada uno con su propio almacenamiento.

Poco despus, los usuarios sintieron la necesidad de compartir esos datos por medio de aplicaciones. As, de acuerdo con el crecimiento de la capacidad de los sistemas de disk array (matriz para discos), un nico array poda suplir las necesidades de almacenamiento de varios servidores. De ese modo, naci el storage en red.

El primer requisito compartir datos entre servidores fue contemplado por NAS (Network Attached Storage). Un dispositivo NAS brinda acceso a archivos a los clientes conectados, utilizando protocolos de transporte en Ethernet y TCP/IP. Las SANs (Storage Area Networks) permiten que diversos servidores compartan espacio en disco, a partir de uno o ms disk arrays. Las SANs permiten que los servidores tengan acceso al almacenamiento en bloque, utilizando la tecnologa de Fibre Channel.

En el paradigma del NAS, el sistema de archivos que organiza bloques de almacenamiento en objetos convenientes para las aplicaciones que trabajan con ellas reside en el dispositivo de almacenamiento, que es el responsable de la asignacin de espacio y de evitar que los clientes sufran inconvenientes cuando hacen pedidos de acceso a archivos.

Del lado del host de la interconexin, un cliente traduce los pedidos de entrada y salida de archivos de las aplicaciones a mensajes de red, y los enva al dispositivo NAS, para que sean ejecutados.

En una SAN, el sistema de archivos est del lado de la computadora de la interconexin. La administracin de la capacidad de almacenamiento para todo el sistema y los conflictos entre las solicitudes de acceso a datos de los clientes se resuelven con la cooperacin entre los servidores conectados a la SAN. Eso hace que el software del lado del servidor sea mucho ms complejo que con los dispositivos NAS.

Al absorber el sistema de archivos en el dispositivo de almacenamiento, el modelo NAS facilita el acceso simultneo a los datos, efectuado por diferentes tipos de computadoras. Actualmente, el NAS es el nico medio ampliamente disponible para hacer que los mismos datos sean accesibles para diferentes tipos de computadoras.

Adems, los protocolos de acceso a archivos del NAS son muy genricos y ricos en funcionalidad.

Y tambin se conectan a redes basadas en TCP/IP, que son proyectadas para trabajar con topologas de interconexin muy generalizadas.

Debido a su gran funcionalidad y generalidad, esos protocolos son predominantemente implementados en software, ejecutado ms lentamente en comparacin con el firmware y el hardware a nivel del dispositivo, generalmente utilizados para implementar protocolos de SAN.

El desempeo del acceso a los datos brutos por parte del dispositivo NAS, por lo tanto, tiende a ser menor que el de otros dispositivos SAN semejantes, y la utilizacin del procesador del servidor y del cliente para el acceso a datos tiende a ser mayor.

En sntesis, actualmente, el equilibrio entre las ventajas y desventajas es el siguiente:

Elija NAS para obtener simplicidad en lo que respecta a compartir datos, particularmente entre computadoras y sistemas operativos diferentes.

Elija SAN para obtener el mayor desempeo bruto de entrada y salida de datos entre el cliente y el servidor. Est preparado para desarrollar algn proyecto y administracin operativa adicional, para lograr que los servidores cooperen (o, por lo menos, no interfieran) entre s.

En todo el proceso de almacenamiento en red, es importante tener en vista las ventajas que se quieren obtener. Los beneficios especficos que las redes de almacenamiento brindan son diferentes segn cada situacin, pero con las redes de storage, as como con cualquier aspecto

de la tecnologa de la informacin, los beneficios pueden ser clasificados de manera amplia de la siguiente forma:

La reduccin del costo de provisin de servicios de informacin actuales.

La provisin o habilitacin de nuevos servicios, que contribuyen positivamente a los objetivos corporativos en general. Las redes de almacenamiento brindan amplias oportunidades para que un departamento de servicios de informacin ofrezca los dos tipos de beneficios. Por ejemplo, en el sector de economa de costos.

Si todo el almacenamiento online es accesible para todas las computadoras, entonces no se necesita ningn almacenamiento temporal para organizar los datos protegidos por una computadora y utilizados por otras. Esto puede representar un sustancial ahorro de costos, en trminos de capital.

De la misma forma, si todas las computadoras tienen acceso directo a los drives de cinta y administradores de medios robotizados, ser necesario un menor nmero de dispositivos caros y no utilizados con tanta frecuencia, en toda la empresa. Esto tambin reduce el costo total de capital corporativo, relacionado al procesamiento de informaciones, sin disminuir la calidad del servicio brindado.

Sin embargo, probablemente lo ms importante sea la economa administrativa y operativa, por no ser necesaria la implementacin ni la administracin de procedimientos para copiar datos de un lugar a otro. Esto puede reducir mucho el costo relacionado con el personal el nico componente del costo de los servicios de provisin de informaciones que no disminuye cada ao.

Implementacin del software

Hoy, la mayora de las implementaciones de almacenamiento en red se concentra en las interconexiones (como Fibre Channel), que permiten la conectividad universal entre los dispositivos de almacenamiento y las computadoras conectadas a ellas. Pero las interconexiones en s no agregan ninguna funcionalidad al procesamiento de informaciones, slo permiten que esa funcionalidad se agregue.

Para obtener los beneficios prometidos por el almacenamiento en red, no slo la conectividad, el desempeo, la disponibilidad y las funciones de hardware deben estar disponibles, sino tambin los softwares de sistema y de aplicaciones deben aprovechar el hardware.

Al evaluar a la tecnologa de almacenamiento en red, los componentes de hardware deben ser observados detalladamente, por seguridad. Sin embargo, lo ms importante es que tambin es necesario observar cuidadosamente los recursos de software, para garantizar que la adopcin proporcione la funcionalidad habilitada por el hardware.

Vea los siguientes ejemplos de cmo el software ayuda a obtener los beneficios del almacenamiento en red:

Comparte drives de cinta: un tape drive conectado a la SAN puede ser compartido entre servidores, porque esos dispositivos son caros y, en verdad, se usan solamente durante la realizacin de backups.

Si un tape drive est conectado a diferentes computadoras por medio de una SAN, stas podrn utilizarlo en diversos momentos. Podr efectuarse el backup de todas las computadoras. La inversin en drives de cinta se utiliza de modo eficiente, y los gastos de capital son bajos.

Compartir dispositivos de almacenamiento online: dentro de un subsistema RAID (Redundant Array of Inexpensive Disks) corporativo, es similar al modo de compartir drives de cinta, exceptuando el hecho de que los procedimientos y requisitos para las modificaciones de configuracin son ms dinmicos.

Un tpico subsistema de RAID corporativo hace que la capacidad de almacenamiento online de uno o ms disk arrays se asemeje a la de uno o ms discos muy grandes, rpidos y confiables. Un subsistema RAID es como diversos discos virtuales, desde el punto de vista de los servidores host.

Es bastante razonable que diferentes servidores tengan acceso a esos discos virtuales en diferentes momentos. Por ejemplo, un servidor puede recolectar los registros diarios de transacciones de una empresa, hechos en disco, y enviarlos a otro servidor, al finalizar el da, para realizar un resumen, un anlisis o un backup.

Reemplazo de aplicaciones con inconvenientes: una vez que las SANs conectan todos los dispositivos de almacenamiento de una organizacin a todos sus servidores, se pueden crear entornos informticos de alta disponibilidad, en los cuales una computadora sustituta pueda entrar en actividad en reemplazo de otra que falle, reiniciar sus aplicaciones, y comenzar nuevamente el procesamiento de sus datos.

Al fin y al cabo, esos equipos son computadoras, y por eso deben estar en condiciones de reconocer los sntomas de un defecto y activar otra computadora en su lugar, automticamente. Lo ideal sera que lo mismo sucediera de modo transparente con las aplicaciones para aprovechar

los entornos de computacin altamente disponibles, ya que no es prctico reescribir todas las aplicaciones de la noche a la maana.

Compartir datos: medios ms avanzados de agrupamiento o clustering de computadoras permiten compartir simultneamente datos entre diferentes aplicaciones ejecutadas en diferentes servidores. Esto puede ser de gran utilidad, por ejemplo, para el crecimiento adicional de aplicaciones o el escalonamiento. Simplificando, si una aplicacin supera el tamao del servidor donde se ejecuta, no es necesario reemplazar el servidor por uno ms grande.

En lugar de eso, se puede conectar otro servidor que tenga la potencia adicional necesaria para la SAN, conservando el sistema original. Ambos servidores pueden ejecutar copias o instancias separadas de la aplicacin, procesando la misma copia de los datos. Pueden agregarse ms servidores, a medida que los requisitos de capacidad de la aplicacin aumentan.

Construir una SAN le proporciona beneficios tangibles a la empresa, ya que se comparte mayor cantidad de datos, se utilizan equipos y se administran los recursos de storage de manera centralizada. Esto debe equilibrarse a travs de un enfoque racional de seguridad de datos para permitir que los beneficios de la SAN no comprometan la integridad del patrimonio corporativo ms importante, los datos.

Una cuestin comn relacionada con la seguridad de los datos, en los actuales entornos de SAN, son los inflexibles e incompatibles mecanismos de divisin en zonas en los actuales switch y HBAs (adaptadores de bus de host). Dependiendo de la zona implementada por el fabricante y del conocimiento que el cliente tenga del software, el esquema de proteccin de datos pude no ser vlido.

Esto sucede si la SAN es reconfigurada (es decir, se mueve un host o un dispositivo de almacenamiento de un puerto de conmutador a otro) o se agregan nuevos hosts (es decir, nuevos

hosts Microsoft Windows escribiendo etiquetas para LUNs - Logical Unit Number actualmente utilizados por un host Unix). El software puede ayudar a disminuir este problema, controlando el acceso a herramientas de divisin en zonas que administran los conmutadores y HBAs y brindando acceso a listas de control por LUN, que protegen los datos existentes.

Conectividad

El almacenamiento en red permite la conectividad entre cualquier servidor y dispositivos de almacenamiento, y tambin aumenta la capacidad de migracin de datos en las organizaciones. El almacenamiento en red puede disminuir los costos del procesamiento de informaciones, aumentando las posibilidades de compartir dispositivos y capacidad, por medio de comunicaciones ms eficientes.

Esto crea el entorno para la verdadera computacin global - la capacidad de procesar las mismas informaciones en cualquier momento, a partir de cualquier centro de datos en el mundo, con los datos y la ejecucin de aplicaciones primarias migrando hacia lugares ideales, de acuerdo con la necesidad.

Actualmente, no basta con tan slo los sistemas de almacenamiento. La necesidad de datos intactos y seguros es tan grande que contar con un backup corporativo es fundamental. En la actualidad, los sistemas corporativos requieren soluciones de backup cada vez ms veloces, flexibles y confiables, preparadas para trabajar con una multiplicidad igualmente mayor de plataformas.

Esa necesidad de garantizar la integridad y la seguridad de la informacin es tan grande que los profesionales de redes no pueden solamente contar con simples sistemas de almacenamiento, sino que precisan recursos ms eficientes, como backups corporativos, por ejemplo.

La adopcin de esas soluciones depende de una correcta planificacin tecnolgica que debe adaptarse al inters del negocio, integrando en forma inteligente los nuevos hardwares y softwares que ofrezcan medios para administrar constantemente esos componentes.

Ya estn disponibles en el mercado algunas soluciones completas y amplias, que cuentan con infraestructura de hardware, software y prcticas de preventa, mantenimiento proactivo y reactivo y servicios profesionales, orientadas a operaciones de entornos de misin crtica.

El mayor desafo, sin embargo, es desarrollar esa infraestructura para que opere sobre estndares abiertos e independientes de las plataformas de hardware de storage. Pero para eso es necesario contar con un equipo que comprenda la arquitectura de backup.

Existen muchos casos de implementaciones de backup que no logran soportar el alto crecimiento del volumen de datos que, despus de un breve perodo de tiempo, requiere un costoso proceso de reingeniera.

En esas situaciones, normalmente se comenten errores que podran haberse evitado, como el subdimensionamiento de dispositivos de backup, la utilizacin de software con escasas funcionalidades y la falta de planificacin en el uso de las redes de datos, incluyendo la mala implementacin de redes privadas de SAN.

Las restricciones de compatibilidad son tpicas de los softwares dependientes de plataformas de hardware de storage, y normalmente conducen a una adopcin de backup con diversas caractersticas propietarias, que sencillamente no funcionan o funcionan muy mal cuando se incluyen otras plataformas de hardware de storage en el entorno de backup.

La infraestructura de hardware y software de backup debe ser flexible para soportar la mayor gama posible de sistemas operativos (especialmente, Linux, Unix y NT) y poder utilizar las interfaces y utilitarios de backup y restore nativos de las principales aplicaciones del mercado.

La administracin es otro factor importantsimo en la arquitectura. Permite que toda la configuracin y el control de los procesos de backup y recuperacin se realicen en forma centralizada en un nico centro, independientemente de su ubicacin fsica.

Otro aspecto es mantener un entorno confiable de backup/recuperacin, tanto para la compatibilidad del software de backup como para los dispositivos de backup, device-drivers de sistemas operativos, red (Ethernet o Fibre Channel), servidores de aplicaciones/base de datos y vinculados al control y a la ejecucin del backup . La automatizacin debe garantizar la confiabilidad de la operacin, inclusive en situaciones de falla de algunos de los componentes.

La existencia de mecanismos que satisfagan las necesidades de ventana de tiempo de backup, sin interrumpir la operacin normal y en situaciones de recuperacin de accidentes, complementan la arquitectura de backup corporativo.

El conjunto de productos de hardware y software por si slo no garantiza nada. La implementacin exitosa de una solucin corporativa de backup contempla prcticas que engloban informaciones recolectadas en el proceso de preventa, en el cual deben realizarse el primer relevamiento de necesidades y el dimensionamiento.

Relevamiento de los recursos

En este relevamiento, debe abordarse el conjunto completo de servidores (que sern los clientes del backup/recuperacin) y de todos los sistemas operativos, bases de datos y aplicaciones involucradas y de la red de interconexin. Es la informacin bsica para construir los dominios de storage, reuniendo a grupos de clientes con servidores master y de medios.

Tambin deben recolectarse informaciones del cliente relacionadas con el Service Level Agreement (acuerdo de calidad de servicio), exigido para cada aplicacin/base de datos involucrado en el proceso de backup/recuperacin, y la respectiva ventana de backup. Se le pide al cliente que informe qu servicios estn en proceso crtico de continuidad de los negocios y requieren infraestructura para disaster recovery.

El dimensionamiento y la configuracin de los servidores de backup y de los dispositivos de backup (incluyendo el nmero de unidades de cinta para cada dispositivo) deben prescribirse, as como tambin la arquitectura de red y la poltica para compartir unidades de cinta: uso o no de Storage Area Network/Fibre Channel.

Finalmente, debe evaluarse la configuracin de los mdulos de software para los sistemas operativos, aplicaciones y bases de datos involucrados, adems de la configuracin de entornos de cluster e infraestructura de point-in-time copy y disaster recovery, de acuerdo con lo que informe el cliente, adems de los niveles de servicio y ventana mxima de backup.

De esa forma, se podr tener una solucin completa y consistente para garantizar escalabilidad, proteger la inversin y minimizar el tiempo de interrupcin de las operaciones del centro de datos, sin generar un impacto negativo en los negocios de la corporacin.

Errores en procedimientos de backup

El trmino backup est directamente asociado a la seguridad de datos y debe recibir una atencin especial por parte del administrador de red. Cualquier descuido puede ser fatal para los datos ms importantes de una empresa. Conservar los dispositivos de backup en lugares inadecuados y expuestos a la humedad, a la influencia de campos magnticos y a la alta temperatura puede daarlos.

Usar un mismo lugar de almacenamiento para carpetas y archivos de backup y para todos los datos en uso es otro factor de riesgo de prdida de datos en caso de que se presente cualquier problema. Uno problema podra ser, por ejemplo, un dao fsico en el disco rgido, donde se guardan los datos y el backup, juntos.

Otra falla est en dejar que las rutinas de backup se den sin ningn tipo de control y sin acatar los procedimientos especficos de seguridad. Se debe prestar especial atencin a este tema, evitando olvidar el backup o no cambiar el dispositivo e inclusive ignorar la poltica de seguridad de la empresa.

Es imprescindible elaborar un conjunto de procedimientos llamados poltica de backup (o backup off site), que consiste en retirar peridicamente los dispositivos de almacenamiento del lugar donde se genera el backup.

Ese dispositivo generalmente se mantiene fuera de ese lugar. De esa forma, inclusive en caso de accidente (incendio, explosin etc.), los datos estarn resguardados en un lugar seguro.

Productos de backup corporativo

Los productos de backup corporativo disponibles en el mercado son diversificados y diseados para el ptimo uso con una biblioteca de cinta, satisfaciendo las necesidades del administrador de red de diferentes maneras.

Sin embargo, considerando que la demanda de backup de datos es universal, es importante brindar funcionalidad y confiabilidad junto con una interfaz apropiada para administradores con variados niveles de experiencia.

Tambin se necesita flexibilidad, pues los administradores de red deben editar tareas existentes y reconfigurar parmetros con rapidez y facilidad cuando las circunstancias lo exigen.

Un buen producto, por lo tanto, debe trabajar con la diversidad de marcas y estndares que se encuentran normalmente en un entorno de red heterogneo.

Estn disponibles en el mercado algunas soluciones completas y amplias, que cuentan con infraestructura de hardware y software para maximizar la disponibilidad de los niveles de servicio (SLA), orientadas a operaciones de entornos de misin crtica.

La existencia de mecanismos que satisfagan las necesidades de ventana de tiempo de backup, sin interrumpir la operacin normal y en situaciones de recuperacin de accidentes, complementan la arquitectura de backup corporativo.

Tambin es necesario realizar un relevamiento que contemple el conjunto completo de servidores

que sern los clientes del backup/recuperacin y de todos los sistemas operativos, bases de datos y aplicaciones involucradas y de la red de interconexin.

Administrar informaciones eficientemente es un desafo que enfrentan las empresas de todos los tamaos y segmentos. Una mala administracin de los datos puede ocasionar inconvenientes muchas veces ocultos, como la baja velocidad de acceso, la mala utilizacin de los componentes de almacenamiento y un alto costo total de propiedad (TCO).

Ningn sistema de almacenamiento est completo sin una solucin adecuada de copias de seguridad. Asegurar la integridad de los datos es uno de los mayores desafos del sector de Tecnologa de la Informacin (TI) de la empresa, principalmente porque las soluciones como la imagen remota y la copia de datos no logran garantizar esa integridad en situaciones de fallas humanas, sabotajes o inclusive accidentes de proporciones no previstas. En muchos casos, slo una copia tipo backup puede resolver la situacin.

7 - Resultados

La mayor preocupacin de un administrador de TI actualmente es maximizar la utilizacin de los recursos que posee, inclusive de los servidores de storage. El desafo de las empresas es poder migrar a modelos ms adecuados para la compaa sin tener que comprar nuevo hardware antes de una expansin planificada.

Al fin y al cabo, la informtica, como servicio esencial, significa contar con servidores en el centro de datos disponibles cuando se los necesita sin tener que comprar una arquitectura de servidores especfica de una determinada empresa.

Por eso, el almacenamiento est yendo en dos direcciones simultneamente: nueva centralizacin, eliminando las islas existentes, y externalizacin, separando el almacenamiento de la conexin fsica (bus attached) con los servidores. Esas tendencias son denominadas modelo de computacin information centric.

En ese modelo, los negocios se construyen alrededor de sus informaciones, vistas como el activo ms estratgico. Es un cambio significativo del modelo server centric, en el que el procesador es la pieza clave de la computacin y el limitador de la capacidad de acceso a las informaciones.

De esa forma, las informaciones ocupan el lugar central del negocio y las plataformas de procesamiento son conectadas a los equipos inteligentes de almacenamiento. El modelo trasciende plataformas y entornos operativos. Al fin y al cabo, el objetivo es integrar todas las informaciones, brindando una visin simple y unificada.

Caminos del almacenamiento

Los clientes corporativos poseen un gran nmero de servidores y aplicaciones ejecutndose en diversas plataformas. Necesitan un sistema de administracin centralizado, un repositorio central que informe dnde se ejecutar cada aplicacin en un centro de datos heterogneo. Ese sistema de administracin basado en polticas debe trabajar con diversos sistemas operativos, asignndole a cada aplicacin un nivel especfico de prioridad y criterios de rendimiento.

En ese escenario, el controlador de polticas asignara aplicaciones a los servidores basndose en criterios predefinidos y administrara los problemas o las necesidades de nuevas aplicaciones basndose en los conceptos de prioridad y rendimiento. Estamos observando el nivel ms alto del centro de datos y asegurando que los activos de TI estn alineados con las necesidades del negocio.

El objetivo principal de los sistemas de almacenamiento es proteger sus sistemas e informaciones crticas, disminuyendo posibles tiempos de inactividad y aumentando la productividad de sus empleados. La solucin proporciona:

Reduccin de costos, a travs de la optimizacin del almacenamiento y la disponibilidad de las informaciones, disminuyendo costos relacionados con la adquisicin de hardware de almacenamiento.

Seguridad y administracin del activo intangible de las empresas, es decir, las informaciones y datos que posee.

Posibilidad de accin proactiva, anticipndose a problemas, en lugar de reactiva, corrigiendo fallas, inclusive con el relevamiento del conjunto de dispositivos y de recursos ociosos que pueden ser mejor aprovechados.

Hoy, para administrar de modo centralizado el centro de datos, es necesario crear una compleja arquitectura multicapa, usando las plataformas de cluster separadas para administrar cada tipo de hardware. Es muy difcil crear una relacin entre todas esas plataformas para obtener una visin clara y amplia de todo el centro de datos. Las mayores dificultades de los clientes se relacionan con la simplificacin de ese entorno.

Las empresas planifican soluciones para mejorar la administracin de un gran nmero de aplicaciones, ejecutndose en diversos servidores. Es necesario tener la capacidad de administrar adecuadamente cualquier tipo de falla y asegurar que todas las aplicaciones reciban los recursos del sistema, segn las prioridades y compatibilidades predefinidas.

Muchos estudios han demostrado que las compaas implementan excesivos recursos de almacenamiento y slo utilizan la mitad de la capacidad adquirida. Esto significa que el costo real de almacenamiento en esas empresas es el doble de lo que esperaban y acordaron gastar cuando adquirieron hardware para esa funcin. Por eso, adoptan software de almacenamiento, necesario para controlar y aumentar la utilizacin de los recursos.

Las arquitecturas de almacenamiento ideales tambin deben ser flexibles en la implementacin y tener una buena relacin costo-beneficio, adems de integrarse con otras aplicaciones de la empresa. En el entorno actual, caracterizado por rpidas transformaciones, es difcil prever cunta capacidad es necesaria para una nueva aplicacin. Y todava ms difcil es prever la capacidad necesaria en uno o dos aos.

Y si hubiera una fusin, se crearan sucursales o se diera alguna gran reestructuracin? La empresa va a reconstruir toda su arquitectura de almacenamiento? O introducir un nuevo sistema de administracin que exija una nueva capacitacin de todos los empleados de la organizacin?

Para minimizar el costo y la complejidad, la arquitectura de almacenamiento ideal es lo suficientemente flexible como para ajustar las modificaciones a las exigencias de la empresa, al mismo tiempo que preserva un sistema consistente de administracin. El software de almacenamiento brinda la flexibilidad necesaria para preservar consistentes prcticas de administracin, independientemente de cambios en las condiciones o en los requisitos de la empresa.

Las redes de almacenamiento permiten una mayor utilizacin de recursos al ofrecer conectividad y simplifican la administracin al brindar una visin centralizada de todos los recursos. La misma lgica se aplica cuando se examina la separacin de la inteligencia de almacenamiento de los dispositivos propiamente dichos. Es decir, la separacin de la administracin de almacenamiento del hardware de storage ofrece beneficios en la consolidacin de la red de almacenamiento.

Las herramientas de virtualizacin permiten aumentar el uso de recursos al proveer un mecanismo para consolidar el exceso de almacenamiento a partir de varios dispositivos de hardware y presentarlos como un nico y til repositorio de datos. Generalmente, las empresas separan la inteligencia de almacenamiento de las herramientas de storage, a partir de dispositivos de hardware individuales para obtener los beneficios de centralizacin. Un solo conjunto de herramientas administra el hardware de varios fabricantes.

Recuperacin de datos

La creciente cantidad de informaciones a ser almacenada por el mercado corporativo y gubernamental ha sido un buen indicador del potencial de ventas de soluciones para el segmento. Desde comienzos de 2004, los norteamericanos son fotografiados y se registran sus huellas digitales al entrar a Brasil, por decisin de la Justicia Federal. Este es un ejemplo de cmo los datos aumentan y deben ser almacenados, adems de necesitarse el backup para garantizar la recuperacin de los mismos.

Las arquitecturas ms usadas para implementar redes de almacenamiento en las corporaciones son la NAS (Networked Attached Storage) y la SAN (Storage Area Network). La opcin NAS (Networked Attached Storage) es una red de bajo costo, en la que el sistema de storage se conecta a la red LAN y se tiene acceso a los datos por medio de protocolos CIFS, sistema de acceso a drives de red en la plataforma Windows, o NFS, para el entorno UNIX.

Sus principales ventajas son la simplicidad de administracin y la facilidad de integracin con servicios de directorios. Se trata de una arquitectura de rendimiento relativamente bajo si se la compara a la arquitectura SAN. La alternativa NAS viene siendo utilizada para consolidar servidores de archivos o bases de datos con baja tasa de acceso y poca necesidad de rendimiento de I/O.

Las redes SAN son consideradas las ms modernas y rpidas disponibles en el mercado. Son redes flexibles que utilizan interfaces fiber-channel y switches especiales de alta velocidad para comunicar a los servidores con los subsistemas de almacenamiento. Su implementacin permite la comunicacin de diversos servidores con diversos subsistemas de almacenamiento, incluyendo dispositivos de cinta magntica. La arquitectura SAN facilita la administracin, aumenta las posibilidades de compartir los recursos de almacenamiento disponibles y es adecuada para las aplicaciones que requieren muchos recursos de I/O y actividad de consolidacin de storage.

El mercado brasileo - particularmente, los sectores financieros, gobierno, telecomunicaciones y salud - presenta un gran potencial de compra de ese tipo de solucin para cumplir con algunas exigencias en materia de legislacin y, en el caso de los bancos, para adecuarse a los requisitos de Basilea II, las empresas necesitan soluciones de alta disponibilidad.

Toda y cualquier aplicacin que necesite transportar datos por la red gana en productividad con este concepto. Como subnet, una SAN agrega ancho de banda (bandwith) sin requerir una carga adicional en las redes bsicas. Adems, la administracin es ms sencilla. Ya no hay necesidad de buscar informaciones en decenas de servidores, pues ellas estarn centralizadas en un nico centro.

El resultado es la mayor disponibilidad, pues la informacin est disponible en los servidores, independientemente de las aplicaciones, siendo accesible a travs de una red propia, sin degradar las redes bsicas. La empresa tiene un mejor rendimiento, pues no existe overhead del servidor y de su bus central. Cuenta con una mejor administracin centralizada, evitando la dispersin natural de las bases de datos distribuidas, as como tambin los inevitables problemas de out of disc space que ocurren individualmente en los servidores.

El almacenamiento consolidado y centralizado reduce el costo de propiedad, principalmente debido a la eliminacin de las dificultades de la conectividad entre diversos entornos de archivos heterogneos, como los que se encuentran en los diversos sistemas operativos.

Ciclo de vida de la informacin

El costo de almacenamiento de mails puede reducirse hasta un 80% usando soluciones de administracin, segn los fabricantes, por eso ms empresas buscan soluciones de ILM (Information Lyfecycle Management) para bases de datos, ERP, CRM, correo electrnico y e-mail.

Por eso, adems de la virtualizacin, una gran ola para mejorar la utilizacin del storage es la implementacin del ILM almacenado en los dispositivos de la empresa. Algunos estudios muestran que los datos de la mayora de las aplicaciones no necesariamente necesitan estar disponibles para acceso online, a medida que pasa el tiempo. Un ejemplo de eso son los mensajes archivados en la casilla de correo electrnico.

Normalmente, despus de 45 das de su recepcin, ese mensaje, as como sus adjuntos, no necesitan ocupar espacio en un disco ms rpido y, por consiguiente, ms caro. Debido a eso, si la empresa necesita comprar discos, posiblemente implementar la administracin de las informaciones sea una buena alternativa. De esa forma, podr comprar discos ms lentos (y ms econmicos) para transferir automticamente las informaciones utilizadas con menos frecuencia, reduciendo sensiblemente las nuevas inversiones en storage.

Las empresas requieren cada vez ms administracin que garantice buenos niveles de rendimiento y proteccin, para soportar fallas durante el almacenamiento (storage media) y elaborar procedimientos completos en caso de problemas ms graves (recuperacin de accidentes). Asociaciones con fabricantes de software, soluciones de grid storage e integracin de productos para crear soluciones ms completas estn en la mira del mercado.

El ILM permite identificar cada informacin, evaluar su criticidad para el negocio y la necesidad de acceder rpidamente a ella y, finalmente, rever la infraestructura de storage, para permitir slo la ubicacin de los datos ms importantes en medios de alto rendimiento y, por lo tanto, ms costosos, dejando el resto en equipos ms econmicos. Todo esto hecho de un modo dinmico, automtico y transparente para el usuario.

Las empresas tambin requieren ms servicios de consultora. No es difcil comprender el motivo de ese crecimiento. La base del concepto de la categorizacin de la informacin y del almacenamiento jerrquico es el conocimiento, por parte del cliente, de la importancia de cada dato para su negocio. Es decir, por cunto tiempo el material en cuestin es crtico para el trabajo diario de la compaa, cundo se vuelve importante solamente para algunos sectores de la corporacin, cuyo acceso es menos frecuente y, finalmente, despus de cunto tiempo deja de ser necesario que est disponible inmediatamente y puede ser almacenado en un archivo muerto.

Evaluacin de la infraestructura

Tambin es importante recordar que, si bien parte del contenido del archivo muerto es descartable, muchas informaciones deben ser conservadas por tiempo indeterminado de acuerdo con las leyes o normas del sector, por lo tanto, posibles modificaciones pueden provocarle serios problemas a la compaa.

Despus de analizar todas las informaciones - y de categorizarlas -, las empresas y los proveedores deben evaluar la infraestructura existente, adecundola a las necesidades relevadas. De esa forma, las informaciones se conservan en los equipos de alto rendimiento slo mientras son crticas para el negocio.

A continuacin, de acuerdo con reglas definidas por los usuarios, las informaciones deben ser enviadas a dispositivos ms econmicos, que permitan el acceso directo, aunque con cierto retraso - los proveedores advierten que esa diferencia puede ser de segundos. Finalmente, los datos considerados histricos se transportan a medios aun menos costosos y cuyo tiempo de acceso es un poco mayor.

A pesar de ser uno de los tipos de datos en el cual la implementacin del concepto de ILM es ms compleja - por tratarse de informaciones semi-estructuradas -, el alto volumen de mensajes electrnicos que invade los servidores corporativos diariamente y la dificultad de los usuarios para manejarlos resultan en costos elevadsimos para la compaa. Y eso est motivando a los CIOs a encontrar formas automatizadas de organizarlos y almacenarlos.

La clave para que las islas de storage se interconecten con otros aplicaciones de la empresa, como ERP, CRM etc., est en la interoperabilidad entre los protocolos de los fabricantes. Con la popularizacin de las redes de storage, la estandarizacin de los protocolos se transform en un punto de inters para todo el mercado.

Un movimiento importante en ese sentido fue la creacin de SNIA (Storage Networking Industry Association), asociacin que nuclea a 300 fabricantes a nivel mundial. La iniciativa Storage Management Iniciative Specification (SMIS) prueba y divulga especificaciones, realiza tests de compatibilidad e interoperabilidad en las redes SAN y NAS, dndoles ms independencia a los usuarios en cuanto a marcas y fabricantes.

Ahora, el principal objetivo es brindar especificaciones para el protocolo iSCSI, preparando el terreno para la prxima onda de las redes globales en los grandes centros de datos.

8 - Tendencias

Ms espacio para el almacenamiento, reduccin de costos, interoperabilidad y continuidad de negocios. Esas estrategias atraviesan las tendencias del storage para los prximos aos. Y la preocupacin no es solamente ms espacio para guardar datos, sino las tecnologas que optimicen aquellos ya usados, adems de poderosas herramientas de administracin para manejar todo el volumen de informacin.

La interconexin de tecnologas, mantener la agilidad para seguir de cerca los cambios rpidos y tener siempre los datos disponibles son las principales preocupaciones del mundo corporativo. Uno de los desafos es recuperar el control del crecimiento desenfrenado y complejo de las infraestructuras, simplificando la administracin y la rutina de tareas administrativas redundantes. Las soluciones deben detectar ineficiencias en la manera en que las informaciones se administran y almacenan para hacer ms con la misma cantidad o menos recursos.

Proteger y garantizar la seguridad de los datos es el mayor reto de las empresas en el futuro, de acuerdo con una investigacin divulgada por CompTIA, una asociacin del mercado de TI. La seguridad fue citada como la principal preocupacin por un tercio de los 660 ejecutivos entrevistados vinculados con el rea de storage. Gestin y administracin de datos ocupan el segundo puesto, mencionadas por el 17% de los participantes del estudio, seguidas por la aceleracin de acceso a datos almacenados (10%). Slo el 6% de los participantes dijo que el cumplimiento de las normas impuestas por el gobierno es la principal preocupacin.

Para acompaar la velocidad del mercado, los administradores de storage y de redes ya conviven con la convergencia de sus productos, orientndose hacia un nuevo tipo de profesional: el ingeniero de storage, que deber conocer las aplicaciones, entender de redes, conocer el trabajo del administrador de sistemas y el del gerente de almacenamiento.

El camino emprendido por empresas como EMC, Cisco, Brocade y McData sigue los principios de implementar una infraestructura de virtualizacin escalable e interoperable. Un paso importante fue la unin de esas empresas para desarrollar conjuntamente las interfaces de programacin de aplicaciones APIs (Application Program Interfaces). En un futuro cercano, esas interfaces permitirn que las redes locales (LANs), de larga distancia (WANs) y redes de almacenamiento (SAN y NAS) intercambien datos sin problemas de interoperabilidad.

La seguridad y el storage tambin apuntan a la consolidacin, como lo prueba la fusin de Symantec y Veritas, orientndose hacia nuevos productos que unen esas reas.

La evolucin de las arquitecturas de bases de datos pasa por la migracin del tradicional DAS (Direct Attached Storage) al concepto de SAN (Storage Area Network) que se basa en interconexiones pticas de los elementos almacenadores, servidores y switches, y el concepto NAS (Network Attached Storage), con interconexiones basadas en los protocolos de las redes locales.

Cualquiera que sea el modelo de arquitectura de red: SAN, NAS o una combinacin de ambas, la interconexin entre la red principal y el backup puede realizarse por medio de la solucin de telecomunicaciones de storage sobre redes pticas, basada en tecnologas de transmisin ptica Synchronous Digital Hierarchy (SDH). En la cadena de provisin de esa solucin se encuentran las empresas de storage, las operadoras y proveedores de equipos de telecomunicaciones.

Redes IP

La popularizacin de las redes IP se da, en el storage, con la utilizacin de plataformas iSCSI. Para despegar, el mercado aguarda el desarrollo de estndares que estn en curso con iniciativas como la SNIA (Storage Networking Industry Association), que cuentan con un equipo de 400 profesionales, de los cuales cien forman parte de las grandes compaas de storage.

La gran apuesta ha sido el Storage Management Initiative (SMI), dentro de la SNIA, que rene a los proveedores alrededor de la unificacin del proceso de administracin. Una de las etapas de la SMI ha sido, justamente, hacer un intercambio de APIs rumbo a la interoperabilidad basada en protocolos.

Con la popularizacin de las redes SAN (Storage Area Network), una de las apuestas de la industria es la cada de precios para alcanzar nuevos mercados, como las pequeas y medianas empresas. Las presiones de los ltimos cinco aos - en relacin a las SAN y NAS, que ampli la adopcin de las redes de almacenamiento de datos - deben continuar ampliando la venta y la oferta de productos de administracin con el concepto ILM (Information Lifecycle Management), ms giles y ms econmicos, mientras el iSCSI contina ganando mercado.

En los ltimos aos, muchos fabricantes adaptaron sus productos para soportar las IP SANs (redes de almacenamiento que utilizan el protocolo IP), usando el protocolo iSCSI juntamente con el FC-IP (Fibre Channel sobre TCP/IP) o iFCP (Internet Fibre Channel Protocol). Los especialistas no creen que la iSCSI destruya al mercado de las SANs, ya que el FC y el iSCSI estn orientados hacia diferentes necesidades. Los clientes que no quieren un FC dedicado y cuentan con grandes volmenes de storage deben orientarse hacia la iSCSI.

Adems del desarrollo de las redes, la virtualizacin va rumbo a la consolidacin. En la tecnologa, diversos dispositivos, con caractersticas, funcionalidades, rendimiento, niveles de servicio e inclusive medios fsicos diferenciados, se presentan al servidor y a las aplicaciones como si fueran virtuales, simplificando la administracin.

El objetivo principal es garantizar una total utilizacin de la infraestructura, disminuyendo su ociosidad y haciendo ms fcil la implementacin del ILM (Information Lifecycle Management) en todas las aplicaciones, independientemente de la infraestructura. Hay algunos requisitos esenciales para implementar la virtualizacin: escalabilidad, administracin punto-a-punto, interoperabilidad y adhesin a los estndares de la industria.

Grid computing

La industria tambin apuesta al grid computing, arquitectura que agrega una capa a la SAN, que virtualiza datos en mltiples arrays. Pero no es suficiente con utilizar la tecnologa de integracin de discos y la virtualizacin, si la red se pone muy lenta. Para superar ese obstculo, la industria apunta al llamado object storage, que esencialmente utiliza metadatos y el direccionamiento virtual para optimizar las redes.

El object storage usa controladores de metadatos para actuar como un puente entre el dispositivo de storage y el servidor en el que se almacenan los datos. De esa forma, puede brindar la informacin solicitada por la aplicacin de manera eficiente y sin congestionar la red.

El storage grid computing es la transposicin del concepto de grid computing al almacenamiento, es decir, diversos sistemas de almacenamiento son tratados en forma unificada. Para ello, el secreto es la creacin de un modelo de nomenclatura estndar para los datos. Tambin es fundamental que se clasifiquen los datos y adoptar una capa de cach frente a la variedad de storage, para garantizar el rpido acceso a las informaciones crticas. Esto permite almacenar los datos en dispositivos de hardware ms econmicos.

Almacenamiento fsico

En la futurologa de los discos, diversos institutos de investigacin sealan diferentes tecnologas, siempre buscando ampliar la capacidad de almacenamiento. Las lneas de desarrollo van en direccin a los discos pticos, la nanotecnologa y los chips basados en polmeros.

Fsicos de la universidad britnica Imperial College, de Londres, estn desarrollando un disco ptico del tamao de un DVD convencional con capacidad de almacenamiento de 1.000 Gigabytes (GB), que recibi el nombre de MODS Multiplexed Optical Data Storage. Almacena 472 horas de pelculas.

Los desarrolladores de la tecnologa tambin destacan que los discos MODS no sern los primeros en desafiar el dominio de los DVDs, en el mercado audiovisual, ya que los discos BluRay tambin tienen una capacidad cinco veces superior a los discos convencionales (cercad de 25 GB por cara).

Actualmente, los investigadores de la universidad estn trabajando con colegas del Instituto de Microtecnologa de la Universidad de Neuchtel, en Suiza, y con el Departamento de Ingeniera Elctrica y de Computacin, de Grecia, para calcular el precio de los discos MODS para su produccin en serie.

El grupo tambin est trabajando para descubrir un formato que hara al disco compatible con aparatos reproductores de CD y DVD ya existentes. Uno de los investigadores, el Dr. Trk, destac que cree que los primeros discos comerciales de ese tipo estarn disponibles entre 2010 y 2015.

Otra lnea de investigacin es con chips de memoria con pelcula plstica y silicio, que podra abaratar el almacenamiento del futuro. Esa lnea de investigacin rene a HP y a Princeton University, de Estados Unidos. Segn la revista Nature, el paso de la electricidad sobre el dispositivo de pelcula plstica funde al polmero, cambiando su conductividad y permitiendo la

superposicin de capas de memorias.

La tecnologa sera ms econmica porque no usa transistores. Intel y AMD prevn producir memorias basadas en esos polmeros, pero las investigaciones son preliminares porque los investigadores todava estn probando la velocidad del registro y lectura del dato. El dispositivo llamado PEDOT puede contener 1 Megabit de datos en un milmetro. Un centmetro cbico podra almacenar 1 GB de datos.

Qu es la nanociencia y la nanotecnologa?

Los discos magnticos y cintas continan ampliando sus capacidades de almacenamiento con la ventaja del bajo costo. Yendo ms all de los discos magnticos, los investigadores sealan los avances en nanotecnologa, uniendo protenas sintticas y circuitos moleculares para crear chips llamados nanorobots. Existen limitaciones asociadas a la fotolitografa en el diseo de los chips. Una tecnologa clave es la habilidad de ubicar los circuitos a pocos nanomilmetros uno de otro.

Para satisfacer esa necesidad, la computacin molecular comienza a tomar forma. Empresas e institutos de investigacin desarrollan los nanorobots, manipulando protenas sintticas que se acercan a la estructura del ADN.

La esencia de la nanociencia y de la nanotecnologa es la habilidad de trabajar al nivel molecular, tomo por tomo, para crear grandes estructuras con organizacin molecular. La nanociencia y la nanotecnologa se relacionan con la comprensin, el control y la explotacin de materiales y sistemas cuyas estructuras y componentes exhiben propiedades y fenmenos fsicos, qumicos y biolgicos nuevos y modificados debido a su escala nanomtrica (1-100nm).

La meta es explorar esas propiedades para controlar las estructuras y dispositivos a nivel atmico, molecular y supramolecular y aprender a fabricar y a usar eficientemente esos dispositivos para nuevos chips y sistemas que, en el futuro, almacenarn grandes volmenes de datos. Esa tecnologa est orientada a las grandes empresas en el rea del almacenamiento de datos.

En esa direccin, IBM anunci la tecnologa MEMS (Micro-Electrical-Mechanical System) basada en el concepto Millipede o Millipede High-density data storage, tecnologa de alta densidad basada en componentes atmicos, colocados en un sustrato microscpico.

Pequeas depresiones crean una forma atmica microscpica en un polmero que recibe los bits de datos almacenados. El polmero puede ser reutilizado millones de veces, superando a los medios magnticos de grabacin. En el concepto millipede, un array opera en forma paralela, donde cada dato es ledo, escrito o borrado, en su propia rea de almacenamiento.

El Bell Labs, en conjunto con Lucent y Imation, tiene una lnea de desarrollo de sistemas hologrficos de storage que reposiciona las obleas de silicio separadas por nanomilmetros para contener los datos.

En el mercado de discos multimedia, el dispositivo de 1,8 pulgada debe ir ms all de los equipos de MP3, integrando notebooks, PDAs y equipos incorporados (computadoras de automviles). Estos equipos con sistemas de localizacin que tienen acceso a grandes bases de datos podrn almacenar datos e imgenes 3D en discos compactos mnimos.

Вам также может понравиться