Cómo recuperar datos en un sistema de almacenamiento empresarial multicapa

jueves, 5 de enero de 2017 por Michael Nuncic

Los sistemas de almacenamiento empresarial modernos son, ahora más que nunca, complejas creaciones con arquitectura TI y estructura de datos. Hace algunos años estos sistemas se apoyaban solo en una única tecnología básica (RAID), pero hoy en día esto ha cambiado.

Mientras que los sistemas de almacenamiento empresarial modernos siguen valiéndose de esta tecnología, la mayoría de los sistemas de gama alta han implementado ya tecnologías adicionales como la virtualización, la deduplicación o los conjuntos de datos combinados. Con la combinación o la virtualización y la distribución de los archivos y de los datos en otros discos duros del sistema de almacenamiento existe al menos una capa de virtualización de datos adicional que debe tenerse en cuenta. Cuando se utiliza una única tecnología para combinar una máquina virtual con una estructura de software definida, existe todavía otra capa más. Dependiendo de cómo haya diseñado el producto el fabricante, los datos pueden almacenarse en muchas capas distintas y todas ellas deberán reconstruirse en caso de pérdida de datos.

A pesar de que los sistemas de almacenamiento modernos utilizan tecnologías diferentes y complejas que dificultan el proceso de recuperación de datos, sigue siendo posible recuperarlos (aunque todo depende siempre de la situación en concreto).

Una pesadilla virtual

Hemos trabajado con muchos casos en los que conseguimos una recuperación de datos satisfactoria de un sistema de almacenamiento de gama alta con múltiples capas de datos. En uno de esos casos, un sistema VMware vSAN sufrió un colapso total porque se había utilizado en él una única memoria SSD para la memoria caché.

Empecemos con un poco de contexto

Desde marzo de 2014, VMware ofrece la opción vSAN para que los servidores vSphere EXSi organicen y gestionen almacenamientos. Desgraciadamente, el sistema falló tan solo unos meses después. Este tipo de sistema vSAN combina aplicaciones o datos guardados en máquinas virtuales en un almacenamiento de datos compartido único, conjunto y en clúster. Todos los ordenadores centrales conectados y sus discos duros son parte de él.

Este sistema en particular consistía en 15 discos duros y tres memorias SSD. Con la avería de una sola SSD, fallaron tres ordenadores centrales/nodos y se produjo una pérdida temporal de cuatro grandes máquinas virtuales. No es de extrañar que el equipo responsable sufriera sudores fríos al tener que afrontar la pérdida de datos empresariales críticos.

Para recuperar y guardar todos los datos perdidos del sistema de almacenamiento que había fallado, tuvimos que desarrollar nuevas herramientas de software que encontraran los archivos de descripción y de registro necesarios para la identificación y recopilación de los datos. Los almacenamientos de datos funcionaban como contenedores, así que en primer lugar tuvimos que identificar los enlaces a las máquinas virtuales existentes y a continuación reconstruirlos.

Con las nuevas herramientas fuimos capaces de comprender cómo se guardaban las máquinas virtuales en el almacenamiento de datos vSAN y cómo se distribuían a los discos duros afectados. Entonces pudimos encontrar rápidamente los archivos de descripción y de registro, lo cual facilitó significativamente el proceso de recuperación (y que conste que recuperamos la totalidad de los datos).

Centro de datos empapado

Otro de los casos en los que trabajamos recientemente saca también a relucir lo difícil que puede ser la recuperación de datos en una estructura multicapa altamente compleja de un sistema de almacenamiento de alta gama.

Recibimos un HP Storage Works EVA (Enterprise Virtual Array) 6000 que contenía archivos de base de datos SQL empresariales críticos e información sobre el personal. Debido a un desastre natural, el sistema de almacenamiento se había inundado y ya no se podía acceder a él.

Puesto que los sistemas HP EVA están totalmente virtualizados, funcionan con grupos de discos y discos virtuales en lugar de conjuntos RAID y discos duros lógicos normales. En un HP EVA, todos los discos físicos y su contenido están, por tanto, organizados aleatoriamente en grupos de discos. Los discos duros lógicos en el mundo virtual EVA, llamados vDisks, se distribuyen en todas las HDD instaladas. En este caso, 80 discos duros contenían 18 RAID virtuales configurados con matrices VRAID 1 y VRAID 5.

Una vez realizada la limpieza y la reparación de los 25 discos duros del sistema de almacenamiento, la labor de recuperación de datos lógicos podía comenzar. Para ser capaces de volver a obtener acceso a los datos en los discos duros dañados, necesitábamos no solo averiguar cómo estaba estructurado como conjunto el sistema de archivos de datos EVA, sino también aplicar ingeniería inversa desde cero a todo el sistema.

El origen de los datos

Para averiguar exactamente cómo estaba diseñado el sistema EVA, tuvimos que adquirir hardware idéntico. Realizamos varias configuraciones para descubrir cómo están construidas las estructuras de sistemas de archivos EVA personalizadas, ya que estas definen el modo en que los datos se distribuyen desde los discos duros.

En cuanto comprendimos cómo se había mapeado la estructura de sistema de archivos y los vDisks en todos los discos, reconstruimos el sistema EVA al completo con los discos físicos originales. Dado que la recuperación de datos en HP EVA se produce solo a nivel de disco, recopilamos virtualmente los grupos y los subgrupos de discos y a continuación reconstruimos los vDisks.  Para recuperar los datos guardados en ellos, nuestro equipo de Investigación y Desarrollo creó nuevas herramientas que nos permitiesen su extracción.

Después de casi seis semanas de labores de desarrollo, reingeniería y recuperación exhaustivas,  el proyecto se completó con éxito. Utilizando las herramientas recién creadas pudimos recuperar cuatro terabytes de archivos de base de datos SQL sensibles (casi el 90 por ciento de los datos perdidos por la inundación).

El regreso de los muertos vivientes

Estos dos ejemplos muestran que no hay duda sobre la posibilidad de recuperar datos de almacenamientos que se sirven de tecnologías diferentes con varias estructuras de datos por capas. Para recuperarlos correctamente, no obstante, se debe acceder a ellos consecutivamente. La cantidad de capas que deban reconstruirse y la cantidad de accesos que deban crearse dependerá del producto de almacenamiento y de la arquitectura subyacente.

Si hay algo seguro es que, si un fabricante utiliza su propio sistema de archivos único o mezcla varias tecnologías dentro de su propio sistema, será más difícil identificar el problema tras una pérdida de datos.

Cada sistema y proyecto de recuperación de datos presenta sus propias peculiaridades que deben superarse. Por esto es importante escoger un proveedor de servicios de recuperación de datos experimentado que cuente con las herramientas y los conocimientos necesarios para ayudarte con la configuración específica del sistema de almacenamiento de alta gama.

El blog de la recuperación de datos

Si ha sufrido una pérdida de datos, contáctenos inmediatamente.