CAUSAS DE LOS CORTES
Las investigaciones sobre los incidentes mostraron que las principales causas fueron fallas en los dispositivos de hardware en los centros de datos, dijo el Dr. Puthucheary.
En los días previos al incidente del 27 de agosto, fallaron dos nodos (dispositivos de hardware que funcionan en tándem) en las zonas de firewall en los centros de datos.
El sistema generalmente tiene otros nodos para administrar la carga de tráfico de datos para continuar con las operaciones de servicio si uno falla. El 27 de agosto, mientras los ingenieros intentaban restaurar los dos nodos fallidos, la operación fracasó. Esto provocó que el grupo de nodos del cortafuegos funcionara mal, lo que posteriormente provocó la interrupción.
El Dr. Puthucheary dijo que los ingenieros trabajaron para restablecer los sistemas al estado anterior sin la función de los dos nodos afectados y el servicio se restauró progresivamente.
“La falla de los nodos fue causada por errores en el firmware de los dispositivos. Desde entonces, han sido identificados por el fabricante, CISCO, y los dispositivos han sido reparados”, agregó.
El incidente del 5 de septiembre fue causado por «la falla simultánea de dos nodos más, nuevamente del mismo fabricante y del mismo modelo», señaló el Dr. Puthucheary.
La forma en que ocurrió la falla fue diferente a la del incidente anterior y se necesitó más tiempo para restaurar las operaciones. La causa de esta falla aún está bajo investigación.
«Hubo una sugerencia en una de las preguntas de los miembros de que las fallas pueden deberse a la falta de mano de obra de IHiS. IHiS tiene una plantilla de 3500 personas, tienen mucho que hacer y siempre aceptarán más mano de obra, pero la falta de mano de obra no es la causa de estas fallas», dijo el Ministro de Estado Mayor.
Agregó que no había indicios de compromiso de seguridad en los sistemas afectados según las investigaciones.
En respuesta a la pregunta del Dr. Tan sobre si los sistemas se compararon con los sistemas «mejores en su clase» en otros lugares, el Dr. Puthucheary dijo: «Existen acuerdos de nivel de servicio sobre la disponibilidad del tiempo de actividad, así como el tipo de facilidad de uso de la interfaz de usuario para los productos que IHiS administra, y estos se comparan con los mejores de su clase en todo el mundo».
El parlamentario He Ting Ru (WP-Sengkang GRC) preguntó qué asistencia se brindó al personal de primera línea afectado y si se les brindó capacitación para lidiar con tales circunstancias.
En respuesta, el Dr. Puthucheary dijo que el apoyo del Ministerio de Salud y el IHiS se centró en «comunicar y brindar información clara sobre lo que sucedió, cuáles son los pasos esperados para restaurar la funcionalidad y cuánto tiempo se requerirá».
Las instituciones de salud también movilizaron personal para hacer frente a las interrupciones y los procesos adicionales involucrados, dijo el Dr. Puthucheary.
«¿Se brinda capacitación? Sí, planes de continuidad comercial… los planes de recuperación ante desastres se practican regularmente en las unidades de atención médica y los equipos son parte de la capacitación estándar para todos los trabajadores de la salud que se encuentran en nuestro sector de atención médica pública. Y la capacitación se actualiza en una base regular.
«Esto no es algo que esté estandarizado en todos los equipos y en todas las unidades del ecosistema de atención médica porque son peculiares de las operaciones y los flujos dentro de cada equipo clínico».