Clase 3: Mantenimiento del Data Center PDF
Document Details
Uploaded by FlourishingDwarf7094
Tags
Summary
Este documento resume los aspectos del mantenimiento del data center, incluyendo varios procedimientos. Se detallan los aspectos de mantenimiento de red, climatización, control de incendios, control de acceso, sistemas de energía, y otros. El documento define tipos de mantenimiento: correctivo, preventivo y predictivo.
Full Transcript
**Clase3** **Transcrito por [TurboScribe.ai](https://turboscribe.ai/es/?ref=docx_export_upsell). [Actualizar a Ilimitado](https://turboscribe.ai/es/subscribed?ref=docx_export_upsell) para eliminar este mensaje.** Vamos a revisar todo lo referente a mantenimiento del datacenter. Podemos apreciar cu...
**Clase3** **Transcrito por [TurboScribe.ai](https://turboscribe.ai/es/?ref=docx_export_upsell). [Actualizar a Ilimitado](https://turboscribe.ai/es/subscribed?ref=docx_export_upsell) para eliminar este mensaje.** Vamos a revisar todo lo referente a mantenimiento del datacenter. Podemos apreciar cuatro puntos, introducción, sugerencias en la revisión de los equipos, los tipos de mantenimiento que tenemos y finalmente la estrategia de mantenimiento. Con referencia a la parte de introducción, todos sabemos de que el datacenter alberga equipos que trabajan las 24 horas, los siete días de la semana y todo el año. Vale decir que son equipos de precisión que no pueden por ningún motivo apagarse o dejar de funcionar o lo que se llama el tema de indisponibilidad, porque evidentemente esto afecta la operación, la caída de algún servicio. Entonces, la parte de lo que es el mantenimiento hace referencia tanto al tema eléctrico y a los equipos informáticos. Con referencia a las sugerencias en la revisión de los equipos, podemos ver las siguientes categorías, mantenimiento de red, climatización, control de incendios, control de accesos, la parte del grupo electrógeno, los UPS o sistema de alimentación ininterrumpida y finalmente la infraestructura. Primer punto, mantenimiento de red. Básicamente hablamos aquí del buen funcionamiento tanto de switches, de routers y equipos de comunicaciones. Climatización se refiere a la revisión periódica justamente de los componentes de la infraestructura de enfriamiento, los que van a permitir mantener el ambiente del datacenter refrigerado y no se pueda sobrecalentar y obviamente los equipos que estén a una temperatura adecuada. Con referencia al control de incendios, tener justamente, revisar la parte de los equipos, los componentes extintores, si están correctos, si están con las fechas vigentes y todos los componentes que involucran la parte de control de incendios. Control de accesos justamente habla del acceso al tema de circuitos cerrados, al tema de cámaras de videovigilancia y cumplir con algunos sistemas audiovisuales generales referente al control de acceso. El grupo electrógeno hace hincapié a la revisión justamente de estos equipos que son, para que lo tengan claro, el grupo electrógeno es el equipo que abastece de energía cuando hay un corte de tu proveedor de energía eléctrica. Es decir, hay que prender el grupo electrógeno para poder abastecer de energía a todo el ambiente, en este caso al datacenter. También hablamos de los sistemas de administración interrumpida, los llamados UPS, que son los equipos que van a permitir que cuando hay un corte de energía, mientras demora el proceso de encender el grupo electrógeno, estos componentes lo que hacen es, mantienen una autonomía, de modo que el switcheo entre que se va la energía del proveedor y prende el grupo, esos 5 o 10 minutos, justamente el UPS es el que va a mantener encendidos los servidores, los equipos en el cuarto de comunicaciones, datacenter, y no se apague. Por eso es importante el mantenimiento de estos componentes. Y finalmente tenemos la parte de infraestructura, que básicamente es la limpieza tanto de hardware, software, la parte del piso técnico, el tema del falso cielo y otros componentes propios del datacenter. Hemos visto la referencia, la sugerencia de los equipos de un datacenter. Como pueden ver, tenemos 3 tipos de mantenimiento, mantenimiento correctivo, llamado también reactivo, mantenimiento preventivo, llamado también activo, y el mantenimiento predictivo, llamado también proactivo. Vamos a hacer un resumen de cada uno de ellos. El mantenimiento correctivo, como su nombre hace referencia, es el que corrige el problema. Es decir, tú ya estás con el problema encima y lo único que te queda es solucionar el problema. Por ejemplo, funciona correctamente y de pronto falló tu router, tu router que va a permitir la conectividad de tu datacenter. ¿Qué es lo que tienes que hacer? Evidentemente cambiar ese dispositivo, ese switch o ese router para poder mantener la operación. En este punto tenemos dos tipos de mantenimiento correctivo, que es programado y no programado. El programado, como su nombre lo dice, es donde tú obviamente coordinas una ventana de tiempo para hacer este cambio, por ejemplo, y el no programado es cuando hay una emergencia, como el caso del router o switch, que obviamente te va a generar indisponibilidad de la operación. Con referencia al mantenimiento preventivo, o llamado también mantenimiento activo, es justamente el que te va a permitir identificar problemas para que puedas actuar en forma inmediata. Y finalmente, el mantenimiento predictivo, llamado también proactivo, este se basa justamente en la parte de mediciones, de métricas, para poder tener todo el tema de indicadores que nos van a permitir más adelante tomar alguna decisión con referencia a un componente. En este punto cabe mencionar de que hablamos de herramientas de monitoreo, que nos van a permitir justamente tener visibilidad de nuestra infraestructura, de la parte eléctrica y de todos los componentes. Eso es con referencia a los tipos de mantenimiento. Las estrategias de mantenimiento, como podemos apreciar en la diapositiva, se tiene que hacer todo un plan integral, que involucra justamente tanto los aspectos operativos como los aspectos técnicos. Y algunas recomendaciones, obviamente es seguir un plan, tener una meta con referente a las interrupciones, porque hay que programar, hay que generar ventanas de tiempo. Tener una documentación al día es fundamental, justamente para ver si el equipo que se va a cambiar tiene garantía, si tiene el FIWARE o los sistemas operativos actualizados y seguir un procedimiento llamado la parte protocolos. Y finalmente tener un esquema o un sistema, en este caso, de monitorización o control. Como ya les había comentado, en este ejemplo podemos ver todo lo referente a alguna herramienta de control, de monitoreo de la red o el monitoreo de tu red eléctrica, que es básicamente lo que se utiliza como estrategia de mantenimiento. Gracias. Vamos a revisar ahora toda la parte del centro de operaciones de red llamado el NO. Definamos en principio qué es gestión de red. Llamamos gestión de red justamente a las funciones que nos van a permitir asignar los recursos necesarios para que una red pueda ser controlable, se pueda planificar, se pueda coordinar, asignar y sobre todo el tema de monitorizar o visualizar. Ahora veamos qué es un NOC. Un NOC es un centro de operaciones de red que justamente es un ambiente donde se monitorea y se gestiona toda la infraestructura tecnológica que existe en el data center. Obviamente para garantizar la disponibilidad y continuidad de la operación. La palabra clave acá con respecto al NOC justamente es lo que ya habíamos comentado, es monitorear y gestionar la red. Pueden ver en la gráfica un centro de monitoreo, un NOC, donde se puede apreciar los monitores y tenemos alguna herramienta de monitoreo que puede ser bajo software libre o bajo alguna herramienta licenciada y obviamente ahí está el operador. Justamente monitoreando toda su plataforma tanto a nivel de hardware y software. Las partes de la gestión de red son cuatro puntos básicos en todo lo referente al NOC. Gestión de configuración y cambios, gestión de control, desempeño y contabilidad. Obviamente en la parte de la operación, gestión de fallas y finalmente la gestión de la seguridad. Cuando nos referimos al primer punto gestión de configuración y cambios, acá sinceramente estamos hablando de la operación como tal. Es decir, tener la topología al día, tener los cambios y tener un inventario, una bitácora de cómo está tu configuración y los componentes. Es decir, tus switches, tus routers y si hay algún cambio, obviamente ir actualizándolo. Esta forma es como se debe hacer una gestión de configuración y cambios correctamente, todo debe estar documentado. En la gestión de control, desempeño y contabilidad se refiere a esta parte justamente de controlar los componentes. El desempeño es la parte vital, es decir, el rendimiento de los equipos. Evidentemente aquí hay que apoyarse con alguna herramienta que nos va a permitir tener visibilidad de los componentes y lo que pronuncia ahí la parte de la operación. La gestión de fallas obviamente es vital en un centro de operaciones de red, en este caso el NOD, porque nos va a permitir actuar en casos de emergencia. Tenemos que tener todo documentado, tenemos que tener un plan de acción, tenemos que tener un rollback en caso falle o tengamos algún incidente que nos provoque o nos ocasione indisponibilidad del servicio. Y finalmente la parte de la gestión de la seguridad, que es un tema vital en la parte de la operación del NOD, porque hace referencia justamente a los tres pilares de la seguridad, que es confidencialidad, la integridad y el accounting, que es el tema de auditoría. Estos son los pilares con referente a la gestión de la red. Resumiendo, hemos hablado de cuatro puntos, gestión de configuración y cambios, gestión de control, desempeño y contabilidad, la gestión de fallas y la gestión de seguridad. Gracias. Vamos a revisar todo lo referente a seguridad física y lógica del datacenter. Tres puntos clásicos que son definición de la política general, seguridad física y finalmente seguridad lógica. La definición de la política general hace referencia obviamente a las reglas generales de la compañía, de la empresa, que define la interacción entre el usuario y los recursos informáticos. Obviamente las políticas son independientes de los ambientes y cada área tiene sus políticas propias y también se tiene una política general de la empresa. Obviamente la política se aplica a colaboradores, a terceros, a proveedores, a todo personal que interactúa en este caso con el ambiente del datacenter. Como seguridad física, su nombre hace referencia, identifica las amenazas, vulnerabilidades, las medidas que pueden ser utilizadas justamente para proteger los recursos físicos de la empresa y en este caso también la parte de la información. Los recursos incluyen personal obviamente que labora o también trabaja en campo y básicamente a los actores que interactúan en este caso con el ambiente, con el área del datacenter. El objetivo de la política es obviamente prevenir el acceso físico no autorizado para evitar daños, robos en el ambiente y mantener el negocio y la operación siempre disponible. Y con referente a la parte lógica, hablamos básicamente de proteger los datos de la información que es la parte más álgida de una compañía. Justamente consiste en proteger la data que está en servidores, está en archivos y tiene que estar en una zona segura. La arquitectura lógica del datacenter se refiere a tener ambientes adecuados no sólo a nivel físico sino a nivel lógico, es decir, redes segmentadas, identificar la red de usuarios, la red de servidores, la red de meseta, la red externa y la red interna. Nos va a permitir trabajar en un ambiente basado en protocolo IP justamente para garantizar el tema de la seguridad. El objetivo principal es evidentemente restringir el acceso a los programas y archivos que son propios y confidenciales de una compañía y que puedan ser manipulables o manipulados o puedan ser modificados por algún tercero. Y justamente hablamos de estos tres pilares de la seguridad de la información que es confidencialidad, disponibilidad y la parte de la integridad. Aquí hacer un hincapié con referencia a la seguridad lógica. Muchas veces está basado en normas como puede ser el ISO 27001 o la ley de protección de datos. Pero a lo que hace referencia justamente proteger la información que es lo más valioso por la empresa. Y en este caso cualquier activo ya sea digital o sea un papel constituye información valiosa para la compañía. Hemos hablado todo lo referente a la parte de la seguridad lógica. Gracias. Vamos a revisar el sistema de aire acondicionado. Tenemos tres puntos que es introducción, características y arquitecturas de enfriamiento. Revisemos un poco de la introducción del sistema de aire acondicionado. Como su nombre hace referencia, el tema de aire acondicionado justamente es la tecnología que va a permitir que el ambiente del datacenter esté refrigerado. Cabe indicar que en el datacenter tenemos aire de precisión. A diferencia del aire de confort que tenemos en las oficinas, este aire de precisión justamente tiene toda una estrategia de refrigeración, tiene la supresión de humedad y tiene otras características que no posee el aire de confort. En resumen, el aire propio y correcto para un datacenter es el aire de precisión. Las características más importantes de un sistema de aire acondicionado de precisión es un caudal de aire correcto, temperatura adecuada, superficie del serpentín y humificación. Como primer punto, el caudal del aire significa justamente tener toda una estrategia de enfriamiento correcta basada en una temperatura adecuada. La temperatura de evaporación de refrigerante de alta temperatura es la que nos va a permitir mantener estable con el correcto tiempo de climatización a un nivel adecuado. La superficie de serpentín de evaporación al igual de velocidad de pasos de aire y finalmente la humificación que es un control integrado de todo el tema de refrigeración. En resumen, estas características van a permitir que la climatización en el ambiente del datacenter sea adecuado y sea correcto justamente para mantener los equipos refrigerados a una temperatura adecuada. Hablamos ahora de lo que es arquitectura de enfriamiento. Podemos ver tres categorías, rack, filas y salas. El tema de refrigeración con respecto a la arquitectura básicamente podemos ver en la gráfica. Tenemos dos términos acá clásicos. Pueden ver pasillo frío y pasillo caliente. El pasillo frío justamente es el aire de precisión que ingresa de abajo hacia arriba como lo pueden ver y en la parte inferior del falso piso están las rendijas por donde entra el aire. Es la parte frontal de los gabinetes y la parte de pasillo caliente justamente es la parte trasera donde están los enchufes que justamente es lo que emanan el calor y que con toda esta estrategia de arquitectura de enfriamiento va a permitir refrigerar el ambiente. Terminamos con la parte de los rack. Podemos ver ahí el tema de los gabinetes, las filas con las cargas de TI y finalmente las salas de enfriamiento que tenemos aquí los rack que ya lo hemos descrito hay todo un tema de flujo y los términos claves acá son pasillo frío y pasillo caliente. Gracias. La parte de las conclusiones podemos apreciar tres puntos claves. En principio la importancia de la estrategia de cableado, estructurado, acceso a internet y el mantenimiento ha permitido al alumno dedicar tiempo al análisis justamente a todo el tema de la estructura de la red de un datacenter. Segundo punto es importante conocer los tres tipos de mantenimiento, vale decir mantenimiento correctivo, preventivo y predictivo y saber aplicar el tipo de mantenimiento en un entorno corporativo justamente para poder prevenir, para poder corregir y para poder controlar toda esta parte de la infraestructura en un datacenter. Y finalmente como última conclusión podemos indicar de que el centro de operaciones debe mantener una buena disponibilidad y continuidad de la operación, obviamente apoyados en una buena estrategia basada en la gestión de los servicios de TI. Gracias. **Transcrito por [TurboScribe.ai](https://turboscribe.ai/es/?ref=docx_export_upsell). [Actualizar a Ilimitado](https://turboscribe.ai/es/subscribed?ref=docx_export_upsell) para eliminar este mensaje.**