La última investigación de Vertiv me recuerda el episodio titulado “El Viejo de la Cueva” de la serie La Dimensión Desconocida. Sufrimos cortes eléctricos en el centro de datos, nos recuperamos de este y le preguntamos al viejo de la cueva qué podemos hacer para que no vuelva a suceder. Pero luego repetimos el ciclo.
Vertiv ha estado trabajando en colaboración con el Instituto Ponemon de forma regular para analizar los cortes eléctricos en el centro de datos. El reciente informe, titulado Los Periodos de Inactividad del Centro de datos en el Núcleo y el Borde de la red: una Encuesta de Frecuencia, Duración y Comportamientos, describe un panorama desalentador, desalentador al menos para nosotros, que comprendemos que los periodos de inactividad pueden evitarse en gran medida cuando los centros de datos adoptan buenas prácticas. Sin embargo, el informe también muestra una oportunidad. Solo tenemos que dimensionarla.
Los niveles actuales de los periodos de inactividad en el centro de datos son inaceptables
Lamentablemente, el informe del Instituto Ponemon aclara que incluso hoy, cuando el centro de datos es más importante que nunca, un fallo al seguir las buenas prácticas lleva a periodos de inactividad inaceptables. Los centros de datos en el núcleo que participaron en esta nueva investigación experimentaron, en promedio, 2.4 cortes eléctricos totales anuales en las instalaciones y 10 eventos aislados de inactividad adicionales en racks o servidores específicos.
Los cortes eléctricos en el centro de datos no solo siguen ocurriendo con mucha frecuencia (el solo hecho de que ocurran también es un problema), sino que los cortes eléctricos totales tienen una mayor duración. La duración promedio de un corte eléctrico total en un centro de datos en el núcleo aumentó a 138 minutos: 8 minutos más que en el estudio anterior. En el borde de la red, la frecuencia de los cortes eléctricos totales en las instalaciones fue incluso mayor, aunque la duración de estos cortes fue menor que la mitad de los ocurridos en los centros de datos en el núcleo.
En palabras sencillas, los periodos de inactividad continúan ocurriendo y tienen una mayor duración que en cualquier otro momento de los pasados 10 años. Con los avances en arquitecturas y tecnologías de infraestructura que hemos visto durante este tiempo, estos resultados son inaceptables.
Resulta interesante que el estudio del Instituto Ponemon mostró que solo el 46% de los centros de datos en el núcleo indicó que utilizan buenas prácticas en diseño y redundancia para maximizar la disponibilidad, mientras que el 62% de las ubicaciones en el borde hizo lo mismo. Más compañías sintieron que las limitaciones de costos aumentaron el riesgo de periodos de inactividad en el núcleo (69%) en comparación con el borde de la red (62%). Los centros de datos en el borde de la red se quedan atrás de las instalaciones en el núcleo en materia de recursos para mantener las instalaciones en funcionamiento después de un corte eléctrico no previsto.
El fortalecimiento del borde de la red
Aunque estas cifras representan un panorama desafiante en general, reflejan lo que estamos viendo en nuestros clientes: el fortalecimiento del borde de la red.
Por naturaleza, las ubicaciones en el borde de la red son remotas y a menudo no cuentan con expertos en TI ni personal en el sitio: en la parte inferior de una torre celular, en un campo de cultivo, en una estación de trenes o en la azotea de un estacionamiento.
Los periodos de inactividad representarían el desplazamiento de alguien hasta la ubicación en el borde de la red, lo cual es solo un ejemplo de los recursos que no se encuentran disponibles para recuperarse tras un periodo de inactividad.
La escasez de talento y las responsabilidades cada vez mayores del ya ocupado personal de TI es otra de las razones por las que el fortalecimiento en el borde de la red se está convirtiendo en una tendencia.
La satisfacción del cliente es otro elemento. Por lo general, los centros de datos en el borde de la red permiten la conectividad del usuario final, lo cual es algo que suele darse por sentado como el aire que respiramos. Probablemente esta sea la razón por la que estamos siendo testigos de una mayor adopción de buenas prácticas en el borde de la red, y por qué las medidas de ahorro imponen menos riesgos que en el núcleo.
Prestar atención a los consejos del viejo en la cueva
La implementación de infraestructura redundante en el centro de datos fue una estrategia citada casi por igual en el núcleo (50%) y en el borde (47%). Si bien los encuestados no sugieren demasiadas adiciones de redundancia como respuesta a los periodos de inactividad del equipo, en Vertiv estamos siendo testigos de un creciente uso de arquitecturas de mayor redundancia en el borde de la red. De hecho, la redundancia es una buena práctica sugerida en nuestro artículo complementario, Revertir la Tendencia al Alza en los Costos de los Periodos de Inactividad en el Centro de Datos.
El monitoreo de la infraestructura en el centro de datos y los sistemas de gestión son otra buena estrategia mencionada en el artículo citado, aunque esta es una buena práctica que continúa siendo relativamente baja en la lista de los encuestados: un 38% en el núcleo y un 36% en el borde hicieron referencia a esta. Con todo, la gestión y el monitoreo son incluso más importantes en el núcleo, ya que muchos sitios no cuentan con personal.
Los sistemas de gestión remota de TI, como las consolas seriales y KVMs, pueden ser héroes, especialmente en el borde de la red. Aproximadamente el 80% de los fallos del equipo de TI está relacionado con el software o firmware. En estos casos, los ingenieros que utilizan herramientas de acceso remoto pueden resolver la situación de manera rápida y remota para minimizar la duración de los periodos de inactividad.
Sin embargo, al analizar la encuesta del Instituto Ponemon y las medidas que pueden adoptarse para evitar los cortes eléctricos en el centro de datos en el futuro, la principal táctica citada tanto en el núcleo como en el borde fue la inversión en equipo de TI. Esto probablemente se deba a la alta frecuencia de los periodos de inactividad relacionados con servidores individuales.
Reparar el problema de forma sencilla y seguir adelante es como ponerle una curita. Solo porque se use no significa que la herida sanará. A menos que se estudie la raíz del problema y se implementen soluciones integrales, como procedimientos, capacitación y medidas para fortalecer la infraestructura, la tendencia de los periodos de inactividad continuará creciendo con duraciones cada vez mayores y eso es incluso más perjudicial en nuestro mundo digitalizado. Solo tenemos que escuchar los consejos del viejo de la cueva. Comience por leer Los Periodos de Inactividad del Centro de datos en el Núcleo y el Borde de la Red: una Encuesta de Frecuencia, Duración y Comportamientos para conocer todos los resultados y Revertir la Tendencia al Alza en los Costos de los Periodos de Inactividad en el Centro de Datos para conocer las estrategias para evitar los periodos de inactividad en sus instalaciones.