Un data center sin monitorización ambiental es como conducir por la autopista con el capó levantado y sin instrumentación. La temperatura de la sala puede estar desviándose hacia un valor peligroso, un rack específico puede estar recibiendo aire a 38 °C en lugar de 22 °C, o puede estar formándose una bolsa de humedad en el rincón donde las tuberías de agua atraviesan el suelo técnico —y el equipo de operaciones no se enterará hasta que los servidores empiecen a fallar.
La monitorización ambiental de un data center o sala de servidores no es una comodidad o una característica opcional: es el sistema nervioso de la instalación, el que convierte datos físicos (temperatura, humedad, presencia de agua) en información accionable que permite prevenir incidentes antes de que se produzcan. Este artículo cubre los tipos de sensores, las estrategias de posicionamiento, los sistemas de gestión (DCIM) y los protocolos de alarma que definen la práctica correcta en entornos IT.
Por qué la monitorización ambiental es crítica en entornos IT
La velocidad del deterioro térmico
Los equipos IT están diseñados para tolerar variaciones de temperatura dentro del rango ASHRAE, pero su tasa de fallos aumenta rápidamente fuera de ese rango. Según la Ley de Arrhenius aplicada a componentes electrónicos, por cada 10 °C de aumento en la temperatura de operación de los componentes, la tasa de fallos aproximadamente se dobla. Un procesador que opera a 70 °C tiene el doble de probabilidad de fallo prematuro que el mismo procesador operando a 60 °C.
Los problemas térmicos en data centers pueden desarrollarse de forma gradual (la carga IT crece lentamente y el sistema de climatización empieza a ser insuficiente) o de forma súbita (fallo de una unidad de climatización en plena carga máxima de verano). En ambos casos, la diferencia entre detectar el problema en 5 minutos y en 2 horas es la diferencia entre una intervención preventiva y una interrupción de servicio no planificada con potencial pérdida de equipos.
La humedad: el problema invisible
La temperatura es visible (los servidores se quejan con alarmas de temperatura, el personal nota el calor al entrar a la sala). La humedad excesiva o insuficiente es invisible hasta que sus efectos son ya irreversibles: corrosión de contactos eléctricos que aparece meses después de que el problema de humedad fue transitorio, daño por descarga electrostática que no puede atribuirse con certeza a un evento específico, o condensación en componentes que ocurrió durante la noche cuando no había nadie en la sala.
La monitorización continua de la humedad relativa, combinada con alertas automáticas cuando se superan los umbrales, es la única forma de detectar estos problemas a tiempo.
El agua en el data center
El agua es, junto con el fuego, el mayor riesgo de daño catastrófico en un data center. Las fuentes de agua en un CPD son más numerosas de lo que parece: tuberías de agua fría para sistemas de climatización in-row o de agua helada, humidificadores de las unidades de climatización, sistemas de extinción de incendios por agua (rociadores, si existen), condensación en superficies frías, y fugas procedentes de pisos superiores.
Un sensor de inundación que detecta la presencia de agua en el suelo técnico y activa una alarma inmediata puede ser la diferencia entre una fuga menor controlada y la pérdida total de equipos de millones de euros.
Tipos de sensores ambientales
Sensores de temperatura y humedad
Los sensores de temperatura y humedad son el elemento más básico y ubicuo de la monitorización ambiental de data centers. Funcionan mediante un transductor que mide la temperatura (termistor, RTD o termopar) y la humedad relativa (sensor capacitivo) y convierten estas mediciones en señales eléctricas o datos digitales.
Tecnologías de sensor:
- Sensores resistivos (RTD/NTC): alta precisión (±0,1-0,5 °C), respuesta rápida, adecuados para monitorización de alta resolución. Más caros.
- Sensores capacitivos de humedad: precisión de ±2-3% HR en el rango de 10-90% HR, adecuados para la monitorización de data centers donde no se requiere la precisión de laboratorio.
- Sensores combinados temperatura + humedad: la solución más habitual para data centers, combinando ambas mediciones en un único dispositivo con una sola conexión de red.
El sensor Vertiv de temperatura y humedad es un dispositivo de rack (diseñado para montarse en el frontal de un rack estándar o en un panel de pared) con precisión de ±0,3 °C y ±2% HR, comunicación SNMP/Modbus para integración con sistemas de gestión, y umbrales de alarma configurables. Incluye sonda remota para medir la temperatura en puntos específicos del rack o del suelo técnico.
Parámetros clave al especificar sensores:
- Precisión de temperatura: ±0,5 °C o mejor para detección de hotspots
- Rango de temperatura: al menos 0-50 °C (los pasillos calientes pueden alcanzar 45-50 °C)
- Precisión de humedad: ±3% HR o mejor
- Protocolo de comunicación: SNMP v2/v3, Modbus TCP/RTU o BACnet (según el sistema de gestión)
- Tiempo de respuesta: < 30 segundos para la alarma de temperatura (suficiente para detección temprana)
Sensores de inundación (detección de agua)
Los sensores de inundación detectan la presencia de agua líquida en el suelo o el suelo técnico mediante un par de electrodos: cuando el agua crea un puente conductor entre los electrodos, se activa la alarma. Existen en dos formatos principales:
Sensores puntuales: detectan agua en un único punto. Adecuados para posicionarse bajo las unidades de climatización in-row, bajo las conexiones de tuberías, y en los desagües del suelo técnico.
Cables de detección de fuga (leak detection cable): cables de varios metros de longitud que se tienden por el suelo técnico a lo largo de las zonas de riesgo (junto a tuberías, bajo unidades de climatización). Detectan fuga en cualquier punto a lo largo de su recorrido e identifican la distancia aproximada del punto de fuga. Esenciales en instalaciones con sistemas de agua helada o in-row con agua.
El sensor Vertiv de inundación combina detección puntual con la posibilidad de conectar hasta varios metros de cable de detección externo, con comunicación SNMP para integración con el sistema de gestión centralizado.
Sensores de presión diferencial
En data centers con suelo técnico elevado, la presión diferencial entre el suelo técnico y la sala determina el caudal de aire que atraviesa las baldosas perforadas. Los sensores de presión diferencial (transductores de presión) permiten monitorizar y ajustar la distribución del aire frío en tiempo real, asegurando que cada zona recibe el caudal necesario.
La monitorización de la presión diferencial es especialmente útil para detectar obstrucciones en el suelo técnico (cables mal gestionados que bloquean el flujo de aire), aberturas adicionales que reducen la presión disponible, o cambios en la distribución de la carga IT que requieren reposicionar las baldosas.
Cámaras termográficas
Las cámaras termográficas de infrarrojos no son sensores ambientales de monitorización continua, sino herramientas de diagnóstico puntual. Una inspección termográfica periódica (1-2 veces al año) del data center puede revelar patrones de temperatura que no son evidentes con sensores discretos: hotspots difusos que cubren varias Us de un rack, gradientes térmicos laterales debidos a corrientes de aire transversales, o puntos calientes en el suelo técnico que indican obstrucciones del flujo de aire.
Posicionamiento de sensores: dónde medir para obtener información útil
El error más común: un único sensor "en la sala"
El error más frecuente en instalaciones pequeñas y medianas es instalar un único sensor de temperatura y humedad en algún punto de la sala (generalmente cerca de la puerta o en una pared) y asumir que ese sensor representa las condiciones en toda la sala. Este sensor puede estar marcando 22 °C mientras hay racks en el extremo opuesto de la sala con temperatura de entrada de 35 °C.
La temperatura en un data center no es uniforme. Existe una gradiente vertical (el aire caliente sube), una gradiente horizontal (los racks más alejados de las unidades de climatización reciben aire menos frío), y variaciones locales debidas a la configuración de los racks, los blanking panels faltantes y la geometría de los pasillos.
Posicionamiento recomendado según ASHRAE TC9.9
ASHRAE TC9.9 recomienda medir la temperatura de entrada en el frontal de cada rack (o al menos de cada N racks según el nivel de monitorización deseado) a tres alturas:
- U5 (5a unidad desde abajo): temperatura del aire en la parte baja del rack
- U20-U22 (zona media del rack): temperatura media
- U40 (cerca de la parte superior): temperatura en la parte alta, donde la recirculación suele ser mayor
El rango aceptable de temperatura de entrada al rack (medido en estos puntos) según ASHRAE A2 es 10-35 °C (rango permitido) y 18-27 °C (rango recomendado). Si cualquier punto supera los 27 °C de forma regular, hay un problema de flujo de aire que debe corregirse.
Posiciones adicionales de monitorización recomendadas:
- Retorno de cada unidad de climatización (temperatura y humedad): para calcular el delta T y evaluar la eficiencia del sistema
- Suministro de cada unidad de climatización (temperatura de salida): para verificar que la temperatura de diseño se está manteniendo
- Bajo el suelo técnico (en las zonas de mayor densidad): temperatura del aire en el plenum del suelo técnico
- Pasillo caliente (a media altura): temperatura del aire caliente para verificar que no hay recirculación hacia el pasillo frío
Densidad de sensores: niveles de monitorización
| Nivel | Sensores por rack | Posición | Aplicación | |-------|-------------------|----------|------------| | Básico | 0 (sala) | 1 sensor ambiental por zona | Sala pequeña, baja densidad | | Estándar | 1 por cada 2-4 racks | Frontal, altura media | CPD corporativo mediano | | Detallado | 1 por rack | Frontal, 3 alturas | CPD mediano-alto, colocation | | Exhaustivo | 1 por rack + retorno | Frontal + trasero, 3 alturas | Data center de alta disponibilidad |
Para una sala de servidores corporativa de 20-30 racks, el nivel "estándar" (un sensor por cada 2-3 racks en la parte frontal a altura media) proporciona información suficiente para detectar problemas de temperatura con una inversión razonable.
Sistemas de gestión: DCIM y plataformas de monitorización
Qué es un DCIM (Data Center Infrastructure Management)
Un DCIM es una plataforma de software que agrega, procesa y visualiza los datos de todos los sensores de un data center en una interfaz centralizada. Los sistemas DCIM modernos van mucho más allá de la simple visualización de temperatura y humedad: integran datos de los sistemas eléctricos (SAI, PDU, cuadros eléctricos), los sistemas de climatización (CRACs, chillers), los sistemas de seguridad y los propios equipos IT (servidores, switches) para ofrecer una visión completa de la infraestructura y permitir la optimización proactiva.
Funciones clave de un DCIM para monitorización ambiental:
- Dashboards en tiempo real con mapa de calor del CPD (temperatura por rack y zona)
- Histórico de tendencias de temperatura y humedad (detección de tendencias antes de que superen umbrales)
- Alarmas configurables por umbral, con escalado (SMS, email, llamada de voz) y horario
- Informes de cumplimiento ASHRAE (porcentaje de tiempo que cada punto de medición ha estado dentro del rango recomendado)
- Correlación entre carga IT (consumo por rack desde PDUs inteligentes) y temperatura de entrada al rack
Vertiv Trellis Enterprise
Vertiv Trellis Enterprise es la plataforma DCIM de referencia de Vertiv para data centers medianos y grandes. Ofrece integración nativa con los sensores Vertiv de temperatura y humedad, las PDUs inteligentes Vertiv, los SAIs Liebert y las unidades de climatización DSE/CRV/PCW a través de SNMP y Modbus.
La arquitectura de Trellis Enterprise permite:
- Inventario automático de dispositivos conectados (autodiscovery por SNMP)
- Visualización en planta del CPD con representación térmica en tiempo real
- Gestión de la capacidad (espacios libres por rack, capacidad eléctrica disponible, capacidad de refrigeración disponible)
- Alertas predictivas basadas en tendencias (si la temperatura de un rack lleva 48 horas subiendo a razón de 0,5 °C/día, el sistema alerta antes de que supere el umbral crítico)
- Integración con sistemas de gestión empresarial (CMDB, ITSM) mediante APIs REST
Vertiv Power Insight
Para instalaciones de menor escala o como plataforma de monitorización de energía (complementaria al DCIM completo), Vertiv Power Insight ofrece monitorización de consumo eléctrico y básica de temperatura/humedad desde las PDUs y SAIs Vertiv, sin la complejidad y coste de un DCIM completo. Es una solución adecuada para CPDs corporativos de 20-100 racks con necesidades de monitorización estándar.
Plataformas de monitorización de terceros y protocolos abiertos
La mayoría de los sensores de temperatura/humedad y de inundación de calidad industrial soportan protocolos abiertos: SNMP v2/v3, Modbus TCP/RTU, o BACnet IP. Esto permite integrarlos con plataformas de monitorización genéricas ampliamente utilizadas en el sector IT:
- Zabbix / Nagios / PRTG: herramientas de monitorización IT open source o comerciales que pueden recoger datos de sensores ambientales vía SNMP junto con los datos de servidores, switches y aplicaciones
- Grafana + InfluxDB: plataforma de visualización de series temporales muy utilizada para dashboards de monitorización ambiental personalizados
- OpenDCIM: plataforma DCIM open source para data centers pequeños y medianos
La elección entre una plataforma DCIM dedicada (Trellis) y una plataforma de monitorización genérica depende de la escala del CPD y las capacidades del equipo de IT. Para data centers de alta disponibilidad o colocation, un DCIM dedicado justifica su coste. Para CPDs corporativos de menor tamaño, una solución de monitorización genérica integrada con la infraestructura de monitorización IT existente puede ser más económica y eficiente.
Configuración de alarmas: umbrales y escalado
Definición de umbrales de alarma
Los umbrales de alarma deben definirse en dos niveles:
Nivel de advertencia (Warning): temperatura o condición que está fuera del rango óptimo pero aún dentro del rango permitido. Requiere investigación y posible acción, pero no es una emergencia inmediata.
- Temperatura de entrada al rack > 27 °C (o el límite superior del rango recomendado ASHRAE para la clase del equipo)
- Humedad relativa < 30% HR o > 65% HR
- Delta T del sistema de climatización < 8 °C (señal de posible recirculación)
Nivel de alarma crítica (Critical): condición que requiere acción inmediata para evitar daño en equipos o interrupción de servicio.
- Temperatura de entrada al rack > 32 °C (límite superior ASHRAE A1) o > 35 °C (límite superior ASHRAE A2)
- Temperatura de retorno de la climatización > 45 °C (señal de posible fallo del sistema)
- Presencia de agua detectada (cualquier sensor de inundación)
- Fallo de una unidad de climatización (señal de control del propio equipo)
Protocolo de escalado de alarmas
El protocolo de escalado define quién recibe cada tipo de alarma, en qué orden y con qué método de notificación:
- T=0: alarma generada por el sensor → registro en el DCIM, envío de email a la lista de distribución de operaciones IT
- T=5 minutos (si no hay acknowledge): SMS al responsable de guardia de IT
- T=15 minutos (si no hay acknowledge de respuesta): llamada de voz automática al responsable de guardia
- T=30 minutos (si no se confirma resolución): escalado al director de IT / CTO
Para alarmas críticas (presencia de agua, temperatura > 35 °C), el escalado debe comenzar inmediatamente en el paso 2 sin esperar al email inicial.
Alarmas por tendencia, no solo por umbral
Las alarmas por umbral simple reaccionan cuando el problema ya ha ocurrido. Las alarmas por tendencia permiten anticiparse:
- Alarma de tendencia de temperatura: si la temperatura en un punto de medición ha aumentado más de 2 °C en las últimas 4 horas sin que haya cambiado la carga IT, puede indicar un problema emergente (fallo parcial de unidad de climatización, obstrucción del flujo de aire, blanking panel caído dentro del rack)
- Alarma de delta T decreciente: si el delta T del sistema de climatización ha bajado más de 3 °C en las últimas 24 horas, puede indicar un aumento de bypass de aire o el inicio de un problema en el sistema de distribución de aire
Cumplimiento ASHRAE: informes y documentación
Registro histórico de condiciones
Para demostrar el cumplimiento con los rangos ASHRAE TC9.9 y con los requisitos de los fabricantes de equipos para la vigencia de la garantía, es esencial mantener un registro histórico de las condiciones ambientales del data center. Los sistemas DCIM modernos guardan el histórico de todas las mediciones, generalmente con una retención de 1-3 años (configurable).
El informe de cumplimiento ASHRAE debe incluir:
- Porcentaje de tiempo que cada punto de medición ha estado dentro del rango recomendado (objetivo: > 99,9%)
- Porcentaje dentro del rango permitido (objetivo: 100%)
- Identificación de los episodios fuera de rango (fecha, hora, duración, temperatura máxima alcanzada)
- Causa documentada de cada episodio y acciones correctoras tomadas
Este informe tiene valor en múltiples contextos: auditorías de sistemas de gestión de la continuidad del negocio (ISO 22301), reclamaciones de garantía de equipos IT, auditorías de clientes de colocation que exigen SLAs ambientales, y certificaciones de data center (Tier, etc.).
Temperatura de punto de rocío y control de humedad
El punto de rocío es la temperatura a la que el vapor de agua del aire comienza a condensarse. ASHRAE TC9.9 especifica el punto de rocío como parámetro de control de humedad porque es un indicador más preciso del riesgo de condensación que la humedad relativa simple (la humedad relativa varía con la temperatura, el punto de rocío no).
Los sensores combinados de temperatura y humedad calculan el punto de rocío a partir de la temperatura y la HR. Los sistemas DCIM muestran el punto de rocío como parámetro adicional y pueden configurar alarmas cuando se acerca a los límites de la clase ASHRAE (17 °C para A1, 21 °C para A2).
Monitorización en instalaciones sin DCIM: soluciones para CPDs pequeños
Para salas de servidores pequeñas (5-20 racks) sin presupuesto para un DCIM completo, existen soluciones de monitorización ambiental sencillas y económicas:
Sensores con display local y alarma audible: el mínimo absoluto para cualquier sala de servidores. Un sensor con display visible desde la puerta de la sala que active una alarma audible si la temperatura supera el umbral. Coste: 100-300 €.
Sensores con alerta por correo electrónico: sensores con conectividad Ethernet o WiFi que envían alertas por email directamente, sin necesidad de servidor SNMP ni sistema de gestión. Configuración simple, coste de 200-500 € por sensor. Adecuados para salas de servidores de oficina.
Soluciones basadas en Raspberry Pi / IoT: para equipos IT con recursos técnicos, plataformas de bajo coste (Raspberry Pi + sensores DHT22) con software de monitorización open source (Home Assistant, Node-RED + InfluxDB + Grafana) ofrecen capacidades de monitorización avanzadas a bajo coste de hardware. Requieren conocimiento técnico para la instalación y mantenimiento.
Monitorización básica integrada en el SAI: muchos SAIs Vertiv (Liebert APM, EXL) incluyen puertos para sensores ambientales y pueden enviar alarmas de temperatura/humedad a través del mismo canal de comunicación SNMP/Network Management Card que se usa para las alarmas del SAI. Si ya hay monitorización del SAI configurada, añadir sensores ambientales conectados al SAI puede ser la forma más económica de empezar.
Preguntas frecuentes
¿Cuántos sensores necesito para una sala de 20 racks?
Para una sala de 20 racks con una densidad media de 3-5 kW/rack, el nivel mínimo recomendado es un sensor por cada 3-4 racks en la parte frontal a altura media, más un sensor en el retorno de cada unidad de climatización. Esto suma entre 6 y 8 sensores de temperatura/humedad, más 1-2 sensores de inundación si hay tuberías de agua en la sala. Para mayor precisión (especialmente si hay racks de densidad más alta), añade sensores a tres alturas en esos racks específicos.
¿Puedo reutilizar los sensores de temperatura del sistema de climatización?
Las unidades de climatización de precisión (Liebert DSE, CRV, PCW) tienen sensores internos de temperatura que miden la temperatura de suministro y retorno del propio equipo. Estos datos son útiles para evaluar el rendimiento del sistema de climatización, pero no son equivalentes a los sensores en el frontal de los racks: los sensores de la unidad miden el aire en la toma de retorno (temperatura global promedio del pasillo caliente) y la salida de suministro, no la temperatura de entrada a cada rack individual. Ambas mediciones son complementarias y necesarias.
¿Con qué frecuencia debo revisar las alarmas y los umbrales?
Los umbrales de alarma deben revisarse: después de cada cambio significativo en la infraestructura IT (añadir racks, cambiar densidad de carga), cada 12 meses como parte de la revisión periódica del sistema, y después de cualquier incidente relacionado con temperatura o humedad. Las alarmas que se disparan con demasiada frecuencia (falsas alarmas) hacen que el equipo empiece a ignorarlas (efecto "alarma de coche"); es importante ajustar los umbrales para que sean significativos y accionables.
¿La monitorización ambiental es obligatoria por normativa en España?
No existe en España una normativa de obligado cumplimiento específica para data centers que exija un número determinado de sensores ambientales o un sistema de monitorización concreto. Sin embargo, varias normativas y estándares aplicables a los sectores que operan CPDs sí tienen implicaciones de monitorización ambiental: el Esquema Nacional de Seguridad (ENS) para administraciones públicas, la norma ISO/IEC 27001 para seguridad de la información, y las guías del Banco de España y la CNMV para entidades financieras incluyen referencias a la gestión de la continuidad del negocio que implican monitorización de la infraestructura crítica. En la práctica, cualquier CPD que quiera obtener la certificación Tier del Uptime Institute debe demostrar monitorización ambiental adecuada.
¿Cada cuánto tiempo se deben calibrar los sensores?
Los sensores de temperatura de calidad industrial tienen una deriva típica de ±0,1-0,2 °C por año. Para la mayoría de las aplicaciones de data center, una calibración o verificación anual es suficiente. La verificación puede hacerse de forma sencilla comparando la lectura del sensor con la de un termómetro de referencia certificado en las condiciones de la sala. Los sensores que muestran desviaciones > 1 °C respecto a la referencia deben sustituirse. Para la humedad relativa, la calibración es más importante porque los sensores capacitivos pueden derivar más rápidamente en ambientes extremos; una verificación cada 6-12 meses es recomendable.