Redefinición del estándar de disponibilidad del sistema

nimble-nephos-it

Las empresas de todos los sectores confían cada vez más en aplicaciones para manejar todo, desde las operaciones de back-end hasta la entrega de nuevos productos, servicios y experiencias de clientes. Ese es el motivo por el cual la disponibilidad del sistema de infraestructura y la eliminación del tiempo de inactividad no planificado son más importantes que nunca antes. Una investigación reciente demostró que el costo promedio de una hora de inactividad es de aproximadamente medio millón de dólares, y este costo no hará más que aumentar con la constante digitalización de las industrias.

Durante demasiado tiempo, la disponibilidad de almacenamiento superior solo fue posible mediante costosos contratos de servicio in situ de modelos de hardware excesivamente redundantes. Desde su fundación, Nimble, una empresa de Hewlett Packard Enterprise se dedicó a la ambiciosa misión de romper el molde y no solo desarrollar una mayor disponibilidad en sus productos, sino también habilitar la mejora continua con el tiempo.

En 2014, Nimble (ahora una empresa de Hewlett Packard Enterprise) anunció lo que en ese momento fue un adelanto: más de cinco nueves de disponibilidad medida. Solo dos años después, Nimble se alejó todavía más de la manada con más de seis nueves (99,999928 %) de disponibilidad medida en toda su base instalada. Esto se traduce en un impacto de menos de 25 segundos al año, una mejora de cuatro veces en apenas un poco más de dos años.

Es importante comprender que no todos los valores de disponibilidad publicados se generan de igual manera, muchos son solo mediciones teóricas. Los detalles sobre cómo se entrega la disponibilidad se diferencian entre sí y reducen el riesgo comercial. Con relación a la disponibilidad de Nimble:

1. Se mide y se basa en valores reales y logrados, no en proyecciones teóricas. Puede confiar en los niveles de disponibilidad futura solo cuando las mediciones del rendimiento pasado son transparentes y comprobadas con clientes y datos reales.

2. Se mide respecto de toda la base instalada, con inclusión de cada modelo y versión de sistema operativo. Mostrar una mejora de las versiones y los productos más recientes es fácil. El desafío es entregar disponibilidad de todo el sistema, incluso de sistemas que han estado en operación durante más de seis años.

3.Mejora permanentemente. Ya empieza siendo más confiable que otros y sigue mejorando con más de seis años de perspectivas y aprendizaje de la base instalada.

4. Es estándar para todos los productos, sin requerir servicio ni condiciones especiales. Desarrollar la mejor disponibilidad de su clase en cada producto sin cobrar una prima adicional ni requerir una configuración o un contrato de servicio especial es esencial para Nimble.

Esta innovación nos lleva a preguntarnos: ¿cómo lo hace Nimble? 

La base para la confiabilidad del sistema de Nimble parte de la arquitectura de la plataforma de almacenamiento. No hay ni un punto de falla (tolerancia a fallas con componentes redundantes). Los controladores duales permiten las actualizaciones sin interrupciones, que no afectan el rendimiento en caso de falla del controlador. Sumado a ello, la arquitectura del software es tolerante a fallas y entrega una integridad de datos extremadamente sólida que incluye Triple+ Parity RAID y validación de seguridad integral.

Sin embargo, hay grados de imprevisibilidad que no se pueden resolver en todo el diseño del sistema debido a la complejidad en las capas de infraestructura. Esto no impidió que Nimble siguiera mejorando en forma significativa y progresando hasta lograr un ciclo de vida de tiempo de inactividad cero. La disponibilidad medida de los arrays de Nimble sigue mejorando mediante los análisis predictivos, el aprendizaje sobre la base instalada y nuestro compromiso respecto de una experiencia de soporte transformada. Nimble está redefiniendo el estándar.

Las secciones que siguen de este informe analizan los detalles, revelan el enfoque único que permitió a Nimble mejorar en forma continua y superar la disponibilidad medida de seis nueves en toda la base instalada.

Cómo se mide la disponibilidad 

Los datos que Nimble recopila de los arrays de almacenamiento permiten medir la disponibilidad en microsegundos. Si bien la mayoría de los arrays no tiene tiempo de inactividad, cualquier periodo de inactividad que sucede se identifica automáticamente, se categoriza y se archiva, lo que permite a Nimble hacer un seguimiento a través de la base instalada, así como por versión de software, modelo o cualquier otra dimensión. Estos registros se conservan bajo normas estrictas, y todo tiempo de inactividad se investiga para garantizar que el impacto al cliente se capture con precisión. En general, las cifras de disponibilidad se monitorean periódicamente, lo que nos permite identificar áreas en las que se pueden hacer más mejoras.
Dado que el seguimiento de la disponibilidad es una herramienta tan poderosa, es importante que sea lo más completa posible. Se incluyen todos los arrays, salvo los sistemas internos usados para el desarrollo y la evaluación. Sumado a ello, se incluyen todos los problemas que generen tiempo de inactividad no planificado, incluso problemas a causa de un problema de un tercero. Se excluyen los periodos durante los cuales no se prevé que un array esté disponible, por ejemplo, un corte de energía general o una situación en la que un cliente cierra el array para trasladarlo a una ubicación nueva.

Contacta a un experto para conocer e implementar este servicio en tu empresa

nimble-nephos-it

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *