Ontrack Data Recovery

Nuevas tecnologías en sistemas de almacenamiento

 
Soluciones a gran escala

Los sistemas de almacenamiento se han convertido en un aspecto singular y complejo de la informática que puede enfocarse desde distintos puntos de vista. Podríamos definirlos como el hardware donde se guardan datos.

Pongamos por ejemplo un pequeño servidor en una oficina de diez o menos usuarios. El sistema de almacenamiento serían los discos duros integrados en el servidor, donde se guarda la información. En entornos de gran empresa, el sistema de almacenamiento puede ser un gran armario SAN lleno de discos duros donde el espacio se ha picado muy fino para proporcionar rendimiento y redundancia.

Los sistemas de almacenamiento: una tecnología en constante cambio

La tecnología de almacenamiento actual engloba todo tipo de soportes. Tenemos, por ejemplo, sistemas WORM, bibliotecas de cintas y bibliotecas virtuales. En los últimos años, los sistemas SAN y NAS han demostrado su excelente fiabilidad. Veamos en qué se diferencian estos dos sistemas:

  • Las unidades SAN (Storage Area Network) pueden ser armarios enormes; algunos pueden tener 240 discos duros. Estos grandes sistemas con más de 50 terabytes de capacidad hacen más que sólo activar cientos de discos duros. Son almacenes de datos de una potencia increíble que emplean utilidades de software muy versátiles para gestionar múltiples arrays, soportar diversas configuraciones de arquitectura de almacenamiento y proporcionar una monitorización constante del sistema.

  • Las unidades NAS (Network Attached Storage) son unidades independientes que cuentan con sistemas operativos y de archivos propios y gestionan los discos duros que llevan conectados. Son unidades de diversa capacidad para ajustarse a las necesidades de cada propietario y funcionan como servidores de archivos.

Desde hace bastante tiempo, el almacenamiento a gran escala no ha estado al alcance de la pequeña empresa. Los sistemas de discos duros SAN Serial ATA (SATA) se están convirtiendo en una manera rentable de disfrutar de gran capacidad de almacenamiento. Estas unidades array también se están incorporando a los sistemas de copia de seguridad en cintas virtuales, es decir, en arrays RAID que se presentan como máquinas de cintas, eliminando completamente los soportes en cinta.

Otras tecnologías de almacenamiento, como iSCSI, DAS (Direct Attached Storage), Near-Line Storage (datos adjuntos en soportes extraíbles) y CAS (Content Attached Storage), también proporcionan disponibilidad. Los arquitectos del almacenamiento saben que una copia de seguridad no basta. En los entornos actuales altamente informatizados, las copias de seguridad acumulativas diarias o semanales completas pueden quedar obsoletas en cuestión de horas o incluso minutos después de ser creadas. En entornos de grandes almacenes de datos, ni siquiera se tiene en cuenta hacer copias de seguridad de datos en continuo cambio. La única salida para estos enormes sistemas es contar con sistemas espejo de almacenamiento: servidores literalmente idénticos con exactamente la misma capacidad.

¿Cómo decidir qué sistema es el indicado? (Ver resumen del estudio de Gartner sobre almacenamiento en discos).
Es necesario realizar un análisis detallado del entorno operativo. Muchos, tanto usuarios como administradores, le dirán que el mejor entorno es el que no se estropea. La cruda realidad es que, pese a la aplicación de planes y políticas de reducción de riesgos, cada día suceden desastres y se pierden datos.

Al estudiar sus necesidades de almacenamiento y las de sus clientes, hágase estas preguntas:

  • ¿Cuánto se tarda en recuperar los datos?
    ¿Cuál es máximo de tiempo que su cliente puede esperar hasta volver a acceder a sus datos? Dicho de otro modo, ¿cuánto puede aguantar su cliente sin sus datos? Ello le ayudará a fijar los requisitos de rendimiento del equipo.

  • Calidad de los datos recuperados.
    ¿Es necesario restaurar los datos originales o basta con disponer de datos antiguos de copias de seguridad? Aquí interviene el programa de copia de seguridad empleado. Si los datos de su sistema de almacenamiento o del de su cliente cambian con frecuencia, los datos originales son los más valiosos.

  • ¿Cuántos datos archiva usted o su cliente?
    Restaurar grandes cantidades de datos a través de una red puede tardar bastante tiempo. En configuraciones DAS (Direct Attached Storage), el tiempo de restauración dependerá del equipo y del rendimiento de E/S del hardware.

Programas exclusivos de protección de datos

Los fabricantes de sistemas de almacenaje buscan maneras exclusivas de procesar grandes cantidades de datos y proporcionar al mismo tiempo redundancia en casos de desastre. Algunas grandes unidades SAN incorporan una complicada organización en bloques, creando en esencia un sistema de archivos de bajo nivel desde la perspectiva RAID. Otras unidades SAN incorporan un registro interno de transacciones en bloques, de modo que el procesador de control de la SAN pueda rastrear en ellas y escribir en cada disco por separado. Con este registro de transacciones, la unidad SAN puede recuperarse en caso de caídas de tensión o paradas inesperadas. (Ver ejemplos de sistemas SAN)

Algunos científicos informáticos especializados en sistemas de almacenamiento proponen añadir inteligencia a la controladora del array RAID para hacerla consciente de los sistemas de archivos. Esta tecnología proporcionaría mayor capacidad de recuperación en casos de desastre, teniendo por meta la consecución de arrays de almacenamiento que se "curan" solos. (Ver A la vanguardia de la tecnología de almacenamiento - Controladoras RAID más inteligentes)

Contar con una reserva heterogénea de almacenamiento de información a donde pueden acceder numerosos ordenadores sin depender de un sistema de archivos de un tipo específico sería otra idea por el estilo. En organizaciones donde existen diversas plataformas de hardware y sistemas, un sistema de archivos transparente proporcionaría acceso a los datos independientemente del sistema empleado para escribirlos. (Ver A la vanguardia de la tecnología de almacenamiento - Sistema de archivos SAN)

Otros científicos informáticos abordan la cuestión de la redundancia de los arrays de almacenamiento con un enfoque muy distinto. Pese a que el concepto RAID se aplica a un número enorme de sistemas, los científicos e ingenieros informáticos buscan nuevas maneras de proteger los datos cuando los sistemas fallan. Los objetivos que impulsan el desarrollo de este tipo de RAID son la redundancia y la protección de los datos sin sacrificar el rendimiento. (Ver A la vanguardia de la tecnología de almacenamiento - Mejoras en la implementación de RAID)

Leer el informe de la University of California, Berkeley (Ver ¿Cuánta información se generó en 2003?) sobre la cantidad de información digital producida en 2003 es para quedarse estupefacto. Aunque su sistema o el de su cliente pueden no tengan terabytes o petabytes de información, en caso de desastre cada archivo es esencial.

Cómo evitar las averías de los sistemas de almacenamiento

Existen muchas maneras de reducir o eliminar el impacto de las averías de los sistemas de almacenamiento. Tal vez no pueda evitar que suceda un desastre, pero sí puede minimizar los problemas en el servicio a sus clientes.

Se puede agregar redundancia a los sistemas de almacenamiento primarios de muchas maneras. Algunas de ellas pueden ser bastante costosas y estar sólo al alcance de las grandes empresas. Una de estas opciones es contar con sistemas de almacenamiento duplicados o servidores idénticos, también conocidos como mirrors o espejos. Además, los elaborados procesos de copia de seguridad o "instantáneas" de sistemas de archivos que siempre cuentan con un punto de referencia sobre el que restaurar proporcionan otro nivel de protección de datos.

La experiencia demuestra que cuando ocurre un desastre con los datos de una organización, a menudo convergen o se desencadenan varios fallos. Por eso, confiar en un solo protocolo de restauración es un enfoque corto de miras. (Ver Información básica sobre las copias de seguridad) Para organizar el almacenamiento con éxito es necesario contar con varios niveles y opciones de restauración.

En Ontrack nos han contado miles de experiencias terribles que empezaron siendo fallos de almacenamiento y acabaron convirtiéndose en verdaderas calamidades. A la hora de intentar recuperar un sistema, algunas decisiones pueden corromper los datos para siempre. He aquí algunas normas de mitigación de riesgos que los encargados de administrar el almacenamiento pueden adoptar para minimizar la pérdida de datos cuando sucede un desastre:

  • Poner un sistema de almacenamiento offline - No vuelva a poner un array o disco online por la fuerza. Cuando una controladora desactiva un disco o array, lo hace por un motivo claro. Obligar a un array a volver a ponerse online puede exponer el volumen a una corrupción del sistema de archivos.

  • Reconstruir un disco estropeado - A la hora de reconstruir una unidad de disco estropeada es importante dejar a la controladora que termine el proceso. Si durante el proceso falla un segundo disco o se pone offline, déjelo y busque los servicios de un profesional en recuperación de datos. Si durante una reconstrucción se sustituye un segundo disco estropeado cambiarán los datos de las demás unidades de disco.

  • Arquitectura del sistema de almacenamiento - Planifique con detalle la configuración del sistema de almacenamiento. Hemos visto muchos casos de múltiples configuraciones en un solo array de almacenamiento. Por ejemplo, tres arrays RAID 5 (con seis discos cada uno) se fraccionan a una configuración RAID 0 y posteriormente se vinculan. Adopte una configuración sencilla de su sistema de almacenamiento y documente cada aspecto del mismo.

  • Durante un corte de luz - Si el problema escala hasta el punto de ser necesaria asistencia técnica del OEM, pregunte siempre si la integridad de los datos corre peligro o si los datos van a quedar afectados de alguna manera. Si el técnico le dice puede haber riesgos para los datos, déjelo y busque los servicios de un profesional en recuperación de datos.

Líderes en recuperaciones de sistemas de almacenamiento

Ontrack lleva muchos años realizando con éxito recuperaciones de datos de grandes sistemas de almacenamiento. Nuestro singular estilo es lo que distingue a Ontrack de otras empresas de recuperación de datos.

Una recuperación de un volumen de datos que implementa una configuración RAID empieza con un técnico superior evaluando cada disco y analizando las estructuras de datos para determinar el mejor método de realizar la recuperación. No existe una configuración estándar de estos sistemas; cada OEM implementa sus RAID con distintas configuraciones, por lo que cada trabajo es único y desafiante. El paso final es verificar si el sistema de archivos señala los datos correctamente, validando la información y los datos que contiene.

Estos tipos de recuperación son tremendamente desafiantes. Ver cómo se recupera uno de estos sistemas después de varias horas de esfuerzo es algo alucinante. Muchas veces con estas recuperaciones se consigue restaurar y guardar archivos originales sin que el cliente deba manipular software o hardware.

El sector de los sistemas de almacenamiento desarrolla constantemente nuevas tecnologías para descubrir mejores maneras de conservar los datos y mantener la continuidad de las empresas. Algunas veces, los sistemas están tan estropeados que el software no puede hacer nada por recuperarlos. Ahí es donde Ontrack entra en los planes de disponibilidad de datos de su cliente. Ontrack ofrece servicios que se adaptan perfectamente a la urgencia con que usted o su cliente precisan que se restauren los datos.

Con casi 20 años de experiencia, fuertes inversiones en I+D y una plantilla de técnicos de recuperación de datos altamente cualificados, Ontrack es la empresa líder en recuperación de sistemas de almacenamiento. Ontrack es el proveedor de soluciones preferido por usuarios, socios y profesionales informáticos con grandes exigencias en cuanto a recuperación de datos.


REFERENCIAS (información en inglés)

Ejemplos de sistemas SAN
EMC Clarion SAN
http://www.emc.com/products/systems/clariion_cx700.jsp
EMC Symmetrix SAN
http://www.emc.com/products/systems/DMX_series.jsp
Hitachi Lighting SAN
http://www.hds.com/products_services/storage_systems/enterprise_storage
Hitachi Thunder SAN
http://www.hds.com/products_services/storage_systems/modular_storage

A la vanguardia de la tecnología de almacenamiento
Controladoras RAID más inteligentes
http://www.usenix.org/publications/library/proceedings/fast04/tech/sivathanu.html

Sistema de archivos SAN
http://adic.com/us/collateral/TechArticle_infostor_SAN_file_system.pdf

Mejoras en la implementación de RAID
http://www.usenix.org/publications/library/proceedings/fast04/tech/corbett.html
http://h18004.www1.hp.com/products/servers/proliantstorage/arraycontrollers/adg/index.html

¿Cuánta información se generó en 2003?
http://www.sims.berkeley.edu/research/projects/how-much-info-2003/execsum.htm

Información básica sobre las copias de seguridad
http://www.adic.com/us/collateral/WPBackup.pdf

Estudio Gartner sobre sistemas de almacenamiento
http://www4.gartner.com/resources/116400/116480/2003_disk_stora.pdf