Integración de información corporativa. Redes de almacenamiento


Corporative Data Integration. Storage Area Networks

Javier Fernández Landa

Resumen

Los dispositivos de almacenamiento se han conectado tradicionalmente a un único servidor mediante buses paralelos que soportan un pequeño número de dispositivos. El estándar Fibre Channel permite implementar redes de almacenamiento que pueden estar formadas por cientos de dispositivos. Una red de almacenamiento simplifica la gestión, proporciona mayor disponibilidad, flexibilidad y escalabilidad, además de mejorar el acceso a los datos y la copia de los mismos.

Palabras clave: red de almacenamiento

Summary

Historically, storage devices were attached directly to an only server with parallel buses that supported a small number of devices. Fibre Channel standard provides a means to implement storage area networks that may consist of hundreds of devices. SAN offers simplified storage management, scalability, flexibility, availability, and improve data access and backup.

Keywords: SAN, Storage Network, Fibre Channel

1.- Introducción

Una red de almacenamiento (SAN, Storage Area Network) es una red de alta velocidad, comparable a una red local, que permite la conexión directa entre servidores y dispositivos de almacenamiento (cabinas de discos, dispositivos de cintas magnéticas, etc.), mediante elementos propios de una red: enrutadores, concentradores, conmutadores, pasarelas. Una SAN puede ser compartida por varios servidores o estar dedicada a un único servidor, puede ser local o extenderse por áreas geográficas más amplias.

2.- Evolución de la conectividad de los dispositivos de almacenamiento

La manera tradicional de interconectar los dispositivos de almacenamiento con los ordenadores ha sido a través de una arquitectura de bus. Son conexiones dedicadas a un solo servidor, que es quien gestiona todo el movimiento de datos desde y hacia el almacenamiento. Este modelo es el que ahora se denomina DAS (Direct Attached Storage, almacenamiento directamente conectado) Este modelo ha evolucionado a lo largo del tiempo dotando de inteligencia sobre la gestión de los datos a la parte del almacenamiento: memorias caché propias, RAID (Redundant Array of Independent Disk) Cabe destacar la importancia adquirida por el estándar SCSI a lo largo del tiempo. El SCSI es un estándar tan antiguo como los renombrados Ethernet o TCP/IP y tan vivo y con tanto futuro como ellos. Aparte de ser una especificación para la conexión mediante un bus paralelo entre procesadores y dispositivos puramente física, es también un potente protocolo de comunicaciones entre "iniciadores" (los procesadores centrales) y "objetivos" o dispositivos que sirven los datos en forma de "bloques".

En las redes de almacenamiento (SAN) los elementos que entran a interactuar son los mismos que en el modelo anterior, pero esta vez cambia la forma de interconexión: lo que era un bus de hasta 15

dispositivos y distancias no superiores a 25 metros se convierte en una infraestructura de red que nos va a permitir ir más allá en el número de dispositivos y servidores y en las distancias entre los mismos.

La tecnología que hace posible una SAN es el estándar Fibre Channel. Existe otro modelo para compartir almacenamiento a través de una red: el denominado NAS (Network Attached Storage, almacenamiento conectado a red) Un dispositivo NAS se conecta directamente a las redes de datos tradicionales basadas en TCP/IP a través de interfaces Ethernet y pone a disposición de los equipos de esta red el almacenamiento que gestiona mediante un protocolo de sistema de ficheros en red (NFS, CIFS o incluso HTTP). Es decir, un dispositivo NAS comparte ficheros mientras que en una SAN se comparten dispositivos de bloques. En el modelo NAS se utiliza una infraestructura de red de datos, mientras que en una SAN se crea una infraestructura de red nueva dedicada y orientada a compartir dispositivos de almacenamiento. Cada uno de los modelos tiene aplicaciones especificas y no son incompatibles entre sí.

3.­ El estándar Fibre Channel

Es un estándar que pretende ser abierto y que permita la interacción de dispositivos y componentes de distintos fabricantes. Está específicamente diseñado para la interconexión de dispositivos de almacenamiento, por lo que trata de aunar las ventajas de una red con las de un canal de datos tradicional. El encargado de redactar este estándar es el comité t11 de la ANSI, que por otra parte también se encarga del estándar SCSI en su comité t10.

3.1.- Niveles del estándar Fibre Channel

3.1.1.- Niveles físicos (FC-PH)

  • FC-0 - Interconexiones físicas y velocidades de transmisión. Este nivel define los conectores, transmisores, receptores y cableado. Define conexiones vía cobre y fibra óptica multimodo o monomodo, con distancias de hasta 30m para el cobre y 10 km para la fibra. Se define una velocidad de transmisión de 100MBps full-duplex, aunque se trabaja en ampliaciones del estándar para velocidades más altas.
  • FC-1 - Esquemas de codificación para la transmisión. Este nivel y el anterior es en muchos aspectos equivalente al nivel físico de la especificación Gigabit Ethernet.
  • FC-2 - Define el control del flujo y el formato de la trama FC, cuyo tamaño es 2K. en esta capa se definen las distintas topologías que pueden presentarse en un puerto Fibre Channel.

3.1.2.­ Niveles superiores

  • FC-3 - Servicios comunes para los nodos. Se implementa en los conmutadores de la red.
  • FC-4 - Define el interface con los protocolos superiores que van a ser transportados por la red Fibre Channel. Estos protocolos pueden ser de red, por ejemplo IP, o de canal de datos, por ejemplo SCSI.

3.2.­ Topologías de red

La interconexión de los nodos de una red Fibre Channel se realiza mediante tres topologías físicas:

3.2.1.­ Punto a punto (Point-to-point)
Conexión única entre dos nodos. Todo el ancho de banda es usado por estos dos nodos.

3.2.2.­ Bucle arbitrado (Arbitrated Loop)
En esta topología el ancho de banda es compartida entre todos los nodos conectados al bucle. Para laconexión de todos los dispositivos de un bucle, hasta un total de 127, se utilizan concentradores (hubs)

3.2.3.- Conmutado (Switched)
Permite múltiples conexiones concurrentes entre todos los nodos conectados a un conmutador o redde conmutadores (Fabric)

3.3. ­ Clases de servicio

El estándar Fibre Channel define diferentes clases de servicio para las comunicaciones entre nodos,que se establecen para cada conexión según las necesidades de la misma a través de unos protocolosde negociación definidos entre los nodos y los elementos de la red.

3.3.1.- Class 1
Conexión dedicada a través de la red equivalente a un enlace físico.

3.3.2.- Class 2
Sin conexión pero con garantía de entrega de las tramas.

3.3.3.- Class 3
Sin conexión y sin garantía de entrega. El flujo se controla en las capas superiores.

3.3.4.- Class 4
Servicio orientado a la conexión pero con sólo un mínimo de ancho de banda garantizado.

3.3.5.- Class 5

Servicio isócrono. No utilizado.

3.3.6.- Class 6
Servicio multicast con conexión.El hardware existente en el mercado implementa principalmente las clases 2 y 3.

4.­ Componentes de una SAN

Los elementos que forman parte de una red de almacenamiento se pueden clasificar en tres grupos.

4.1.- Servidores

Una red de almacenamiento debe ser una red abierta y heterogénea en la que entre a formar partetodo tipo de servidores con todo tipo de sistemas operativos que puedan acceder al almacenamiento de la red. La red entre los servidores y el almacenamiento será transparente a las aplicaciones, que verán los discos y cintas magnéticas compartidas como si fuesen dispositivos locales del sistema. Los servidores se conectan a la SAN mediante uno o varios adaptadores Fibre Channel (HBA, Host Bus Adapter) El software del sistema operativo deberá estar optimizado para la nueva situación: número elevado de dispositivos y varios caminos distintos alternativos para acceder al mismo dispositivo con reconfiguración automática en caso de caída de un camino, sistemas de ficheros adaptados, capacidad de arranque desde un disco de la SAN, etc.

4.2.- Almacenamiento

Los dispositivos de almacenamiento son la base de la SAN. La SAN libera el almacenamiento de tal manera que ya no forma parte de un bus particular de un servidor, es decir, el almacenamiento se externaliza y su funcionalidad se distribuye. Tanto unidades de cinta magnética o librerías y robots de cintas como cabinas de discos se conectan directamente a la red Fibre Channel.

Las cabinas de discos se diseñan teniendo en cuenta la importancia de la disponibilidad y seguridad de los datos contenidos en sus dispositivos. Elementos redundados e intercambiables en caliente: controladoras, módulos de caché, baterías, fuentes de alimentación, discos. El componente fundamental de una cabina de discos es su controladora, normalmente emparejada con otra igual.

Las controladoras se conectan a la SAN mediante puertos Fibre Channel y a la estructura interna de la cabina mediante buses SCSI o conexiones Fibre Channel internas formándose un doble bucle balanceado. Los discos serán dispositivos propiamente SCSI o discos Fibre Channel. Las controladoras tiene funcionalidades de redundancia y paridad tipo RAID, de acceso a los volúmenes o LUN por ellas gestionadas (LUN Masking) y capacidad de tomar el control del sistema transparentemente si su pareja falla.

4.3.­ Elementos de interconexión

Toda la terminología de una red de datos se hereda en el mundo de las SAN para definir los dispositivos y elementos usados para interconectar los servidores con el almacenamiento.

Ya se ha mencionado al hablar del estándar Fibre Channel que existe cableado y conectores tanto para cobre como para fibra óptica multimodo y monomodo. Igualmente existen otros elementos como adaptadores de media (MIA), convertidores de interface (GBIC) y extensores para facilitar mayores distancias en los enlaces.

Un hub o concentrador es el dispositivo de red que permite la creación de una topología de bucle, en la cual todos los dispositivos conectados comparten el ancho de banda.

Un switch o conmutador es un equipo de red de alto rendimiento capaz de interconectar muchos dispositivos o interactuar con otros conmutadores. Al conjunto de conmutadores de una red se denomina fabric o switch fabric. Cualquier dispositivo conectado a un puerto de un conmutador puede conectarse con cualquier otro dispositivo de la red. La infraestructura de conmutadores de una red es la encargada de encaminar todo el tráfico de un dispositivo a otro. También tienen la funcionalidad de restringir a qué puertos puede otro puerto conectarse mediante lo que se denomina port zoning.

Un puente o bridge SCSI permite conectar dispositivos SCSI tradicionales a una red Fibre Channel. Existen también routers o encaminadores que permiten conectar una red Fibre Channel con otro tipo de redes: ATM, IP.

5.- Aplicaciones

Las aplicaciones de una red de almacenamiento proporcionan mejoras en el rendimiento, en la gestión y en la escalabilidad de las infraestructuras de las tecnologías de la información.

El hecho de que servidores y sistemas de almacenamiento compartan la misma red permite la transferencia de datos de tres maneras distintas:

a) Entre servidor y almacenamiento. Es el modelo tradicional de interacción, aunque en el caso de una SAN el mismo dispositivo de almacenamiento puede ser accedido por múltiples servidores.

b) Entre servidores. La propia SAN puede usarse como medio de comunicaciones entre servidores.

c) Entre dispositivos de almacenamiento. La SAN permite la transferencia de datos entre sistemas de almacenamiento sin intervención directa de los servidores.

Son diversas las aplicaciones de una SAN. A continuación se enumeran algunas de ellas.

5.1.­ Gestión centralizada

Una SAN permite agrupar los dispositivos de almacenamiento formando elementos especializados y separados de los servidores. Ya no necesitamos una tarjeta RAID y varios discos para cada servidor, con una cabina de discos y varios servidores en una SAN optimizamos la gestión del almacenamiento.

La interconexión de todo el almacenamiento dentro de la misma infraestructura de red permite la utilización de las técnicas de gestión globales propias de las redes en una SAN.

5.2.­ Compartición de datos

En el caso anterior obtenemos el beneficio de una mejora en la utilización de los dispositivos de almacenamiento, pero seguimos teniendo un modelo en el que cada volumen de almacenamiento es asignado a un único servidor. Tanto el protocolo SCSI como el software de sistema operativo está adaptado para estos casos, todavía no contemplan la situación en que un conjunto de servidores compartan simultáneamente un mismo volumen. Para obtener una verdadera compartición de datos en necesario introducir inteligencia en los elementos de la SAN. Las soluciones propuestas van desde el nivel hardware (ampliaciones del estándar SCSI en la parte del almacenamiento para la gestión de los bloqueos), al nivel del sistema operativo (sistemas de ficheros distribuidos de nueva generación, servidores de bloqueos distribuidos, software de cluster) hasta el nivel de aplicación (gestión del almacenamiento por la propia aplicación de base de datos)

5.3.­ Protección de datos

La oportunidad de conectar unidades de cintas magnéticas a una SAN abre la posibilidad de descargar la red de datos del tráfico de copias (LAN-less backup), incluso si los elementos de la red tienen la funcionalidad adecuada se pueden realizar las copias de disco a cinta sin pasar por el servidor (server-free backup) Nuevas técnicas de protección de datos pueden implementarse en una SAN: mirroring entre dos volúmenes remotos, snapshots de volúmenes como paso intermedio para un volcado a cinta, etc.

5.4.­ Alta disponibilidad

Una SAN permite que varios servidores tengan acceso al mismo volumen de datos por uno o varios caminos dependiendo de la topología y configuración de la misma. Es el escenario adecuado para los entornos críticos y para la implementación de clusters de servidores.

5.5.­ Continuidad de negocio

Una SAN puede extenderse a largas distancias, incluso su tráfico puede ser encaminado a través de otras redes de área extensa. Esto permite soluciones de recuperación ante desastres.

6.- Conclusión

Hoy en día las redes de almacenamiento son una realidad, pero no por ello puede considerarse una tecnología estable. Puede todavía explotarse mejor este tipo de estructuras y lograrse una mayor integración entre todos los productos de los distintos fabricantes. Nuevos estándares, como iSCSI o SCSI sobre TCP/IP, se añaden a los ya disponibles aportando nuevas soluciones a los usuarios.

7.- Referencias

Fibre Channel Association
http://www.fibrechannel.com

Fibre Channel Loop Community
http://www.fcloop.org

Khattar, Murphy & Tarella ­ Introduccion to Storage Area Networks, SAN
http://www.redbooks.ibm.com

Heterogeneous Open SAN Design ­ Compaq Computer Corporation
http://www.compaq.com/storage

Javier Fernández Landa,
(dirección de correo jflanda [at] unavarra [dot] es)

Jefe de Sección de Sistemas y Servicios de Red
Universidad Pública de Navarra