Go to Top

Flape: ¿La solución para el almacenamiento de Big Data?

Flape: ¿La solución para el almacenamiento de Big Data?

La primera vez que apareció el término FLAPE en el horizonte de la IT fue durante el verano de 2014. En ese momento, el debate con respecto a si el almacenamiento en cinta estaba vivo o no era un tema vigente y los lobbystas de todos los sectores —  HDD, SSD y Flash, como así también los fabricantes de sistemas de almacenamiento — lo discutían en los medios y también en Internet.

Al mismo tiempo, los analistas de Wikibon  presentaron una nueva investigación que mostró que, durante un período de 10 años, la mejor forma de retener datos resultó la combinación de las tecnologías de Cinta y Flash. La investigación demostró que la combinación de Flash y Cinta ofrece las mayores funcionalidades y anchos de banda, con precios muy moderados. La investigación también mostró que, durante el período de 10 años, las empresas que utilizaron esta combinación pudieron ahorrar un 300% de su presupuesto destinado a la IT en general.

A partir de estos resultados, el investigador de Wikibon David Floyer postuló que los fabricantes de sistemas de almacenamiento deberían desarrollar nuevas líneas de productos FLAPE para sus clientes, mencionando que IBM u Oracle serían los mejores candidatos para desarrollar un sistema combinado de FLAPE.

Desde ese punto de vista, existen seis usos comunes de la tecnología FLAPE: archivado, copia de respaldo, retención a largo plazo, NAS con escalabilidad, como uno de los niveles en esquemas de almacenamiento de múltiples niveles y para la nube.

La utilización actual de Flape

4 años más tarde, el tema vuelve a tener difusión. A partir de que la tecnología FLASH es cada vez más barata, que el espacio de los medios en cinta se hace mayor y que los discos aparentemente han alcanzado su máximo avance tecnológico, la tecnología FLAPE parece ser la solución al constante aumento de la demanda de almacenamiento en la era de la Big Data.

Callin Sanchez, VP de Enterprise Storage Development en IBM, declaró en una entrevista durante la IBM Interconnect 2017 que la compañía le ha asignado a su equipo de ingeniería global la tarea de descubrir cómo conectar mejor los dos universos a través de un único sistema.

Incluso cuando Sanchez menciona en esa entrevista que el principal uso de un sistema Flape es el de archivado, parece que IBM considera que Flape puede ser una solución menos costosa y más confiable para el análisis de la Big Data a largo plazo.

Éste es un enfoque que abarca más que solamente el archivado, el cual — como remarca Floyer  — sigue siendo mucho más barato de realizar solamente usando cinta. La tecnología Flape (o el enfoque de Cinta Híbrida, como algunas veces se lo denomina) es una nueva forma de gestionar flujos de trabajo complejos en una arquitectura de almacenamiento por niveles.

Dos en uno

La solución es gestionar tanto las tecnologías Flash como Cinta bajo una única solución de software de administración. Este enfoque tiene mucha relación con el enfoque de Almacenamiento Definido por Software (SDS). Según este enfoque, los datos se gestionan automáticamente y los archivos se transfieren y se ubican a través del software de sistemas de almacenamiento FLAPE.

Esta capa de software puede estar basada, por ejemplo, en el Sistema de Archivos Spectrum Scale de IBM, o también en el Spectrum Protect de IBM (para la solución de copia de respaldo en cinta Tivoli TSM). La utilización, combinación y desarrollo más profundo de estas soluciones disponibles en la actualidad ofrecerán la gran ventaja de que, a partir de estas soluciones, el hardware de almacenamiento en cinta podrá ser fácilmente incorporado a los sistemas como otro nivel de almacenamiento y que será posible transferir los datos de un nivel a otro dentro de Spectrum Scale. Sin embargo, no se ha filtrado nada de información referida a la capa de gestión utilizada por IBM.

Mantener bajos los costos

Otra razón por la cual deberían concentrarse en Flape tanto IBM como los proveedores de servicios en la nube, como Amazon, Microsoft, Google y otros, que están buscando con urgencia reducir sus propios costos de almacenamiento, es que no se han producido muchos avances en la tecnología de discos rígidos, mientras que tanto la tecnología de Flash como la de Cinta están rompiendo las barreras tecnológicas.

Con respecto a las velocidades de lectura secuencial para archivos de gran tamaño, normalmente se alcanzan cifras de alrededor de 80-160MB/s para un una unidad de disco rígido de 7200 RPM, y los mejores resultados difícilmente excedan los 250 MB/S. Esas cifras siguen ofreciendo los mismos valores desde hace años.

Uno de esos avances tecnológicos ocurrió el año pasado cuando IBM Research  anunció un nuevo récord: lograron almacenar 330 TB de datos sin comprimir en un cartucho de cinta que cabe en la palma de la mano. Esto significa unos impresionantes 201 gigabit por pulgada cuadrada, los cuales fueron almacenados en un prototipo de cinta magnética por pulverización catódica de Sony. Los consumidores en la actualidad pueden ya adquirir las cintas LTO7 listas para el mercado, las cuales alcanzan los 15 TB de datos comprimidos. El consorcio LTO (IBM, HP y Quantum) publicó una  hoja de ruta de LTO que llega a LTO 12, que en el futuro alcanzará los 480 TB de datos comprimidos por cartucho.

Lo mejor de ambos universos

Las nuevas cintas de generación LTO7, sin embargo, alcanzan velocidades de hasta 750 MB/s por segundo y las unidades para consumidores basadas en Flash como la Samsung 850 Pro o la SanDisk Extreme Pro alcanzan actualmente velocidades de 550 MB/s de lectura y 520 MB/s de escritura — lo cual es más que el doble de la velocidad de un HDD normal.  Además, el precio de los chips FLASH baja continuamente, por lo que la conjugación de las dos tecnologías, con sus respectivas ventajas, se convierte en una combinación perfecta para una amplia gama de utilizaciones futuras.

Picture copyright: Kroll Ontrack GmbH, Germany