{"id":424567,"date":"2026-06-11T13:36:43","date_gmt":"2026-06-11T13:36:43","guid":{"rendered":"https:\/\/pandorafms.com\/?p=424567"},"modified":"2026-06-11T13:36:47","modified_gmt":"2026-06-11T13:36:47","slug":"gpu-monitoring","status":"publish","type":"post","link":"https:\/\/pandorafms.com\/es\/it-topics\/gpu-monitoring\/","title":{"rendered":"GPU monitoring: monitorizaci\u00f3n de GPUs para IA y entornos h\u00edbridos"},"content":{"rendered":"<p>[et_pb_section fb_built=\u00bb1&#8243; admin_label=\u00bbSection\u00bb _builder_version=\u00bb4.22.0&#8243; _module_preset=\u00bbdefault\u00bb custom_margin=\u00bb0px||0px||false|false\u00bb custom_padding=\u00bb0px||0px||false|false\u00bb locked=\u00bboff\u00bb global_colors_info=\u00bb{}\u00bb][et_pb_row column_structure=\u00bb1_4,3_4&#8243; _builder_version=\u00bb4.27.0&#8243; _module_preset=\u00bbdefault\u00bb custom_padding=\u00bb50px||||false|false\u00bb custom_css_main_element=\u00bbz-index:0!important;\u00bb global_colors_info=\u00bb{}\u00bb][et_pb_column type=\u00bb1_4&#8243; disabled_on=\u00bbon|on|off\u00bb _builder_version=\u00bb4.22.0&#8243; _module_preset=\u00bbdefault\u00bb custom_padding=\u00bb||||false|false\u00bb sticky_position=\u00bbtop\u00bb sticky_offset_top=\u00bb100px\u00bb sticky_limit_bottom=\u00bbsection\u00bb motion_trigger_start=\u00bbtop\u00bb global_colors_info=\u00bb{}\u00bb][et_pb_text admin_label=\u00bbindice\u00bb _builder_version=\u00bb4.27.6&#8243; _module_preset=\u00bbdefault\u00bb custom_margin=\u00bb||0px||false|false\u00bb custom_padding=\u00bb||14px||false|false\u00bb link_option_url=\u00bb#1&#8243; global_colors_info=\u00bb{}\u00bb]<\/p>\n<p style=\"font-size: 0.9em; line-height: 1.4em; color: #333333;\"><strong>Secciones<\/strong><\/p>\n<ul class=\"ittopicsul\">\n<li><a href=\"#1\">Qu\u00e9 es GPU monitoring<\/a><\/li>\n<li><a href=\"#2\">Por qu\u00e9 el GPU monitoring importa<\/a><\/li>\n<li><a href=\"#3\">Entornos on-premise, h\u00edbridos y enterprise<\/a><\/li>\n<li><a href=\"#4\">Las m\u00e9tricas clave en GPU monitoring<\/a><\/li>\n<li><a href=\"#5\">nvidia-smi, DCGM y plataformas de monitorizaci\u00f3n<\/a><\/li>\n<li><a href=\"#6\">Los riesgos de no monitorizar GPUs<\/a><\/li>\n<li><a href=\"#7\">De las m\u00e9tricas aisladas a la correlaci\u00f3n operativa<\/a><\/li>\n<li><a href=\"#8\">C\u00f3mo ayuda Pandora FMS al GPU monitoring<\/a><\/li>\n<li><a href=\"#9\">Umbrales, alertas y estados cr\u00edticos<\/a><\/li>\n<li><a href=\"#10\">C\u00f3mo ayuda Pandora FMS a monitorizar bases de datos<\/a><\/li>\n<li><a href=\"#11\">Compatibilidad y requisitos del plugin de Pandora FMS<\/a><\/li>\n<li><a href=\"#12\">GPU monitoring y planificaci\u00f3n de capacidad<\/a><\/li>\n<li><a href=\"#13\">Parte de una monitorizaci\u00f3n de infraestructura IA<\/a><\/li>\n<li><a href=\"#14\">Conclusi\u00f3n<\/a><\/li>\n<li><a href=\"#15\">Preguntas frecuentes<\/a><\/li>\n<\/ul>\n<p>[\/et_pb_text][\/et_pb_column][et_pb_column type=\u00bb3_4&#8243; _builder_version=\u00bb4.27.0&#8243; _module_preset=\u00bbdefault\u00bb custom_css_main_element=\u00bbz-index:0!important;\u00bb global_colors_info=\u00bb{}\u00bb][et_pb_text admin_label=\u00bbseccion\u00bb module_id=\u00bb1&#8243; module_class=\u00bbittopicscontent\u00bb _builder_version=\u00bb4.27.6&#8243; _module_preset=\u00bbdefault\u00bb z_index=\u00bb0&#8243; custom_margin=\u00bb0px||0px||true|false\u00bb custom_padding=\u00bb0px||0px||false|false\u00bb custom_css_main_element=\u00bbfont-family:%22Pandora-Light%22;\u00bb locked=\u00bboff\u00bb global_colors_info=\u00bb{}\u00bb]En los buenos tiempos que dir\u00edan algunos, cuando no era necesaria una hipoteca para adquirirla, la GPU (Graphics Processing Unit) era ese componente que solo importaba a los que quer\u00edan jugar Crysis a toda resoluci\u00f3n. <strong>Hoy es el reactor de antimateria que mueve media industria<\/strong>: el entrenamiento de modelos IA, inferencia, machine learning, simulaci\u00f3n, rendering, an\u00e1lisis de datos y HPC (High-Performance Computing). <strong>Sin GPUs no hay IA<\/strong>, y sin IA, seg\u00fan dicen los visionarios (que la venden), no hay futuro. Uno que, seg\u00fan esos mismos, quiz\u00e1 quede destruido de todos modos por esa misma inteligencia artificial.<br \/>\nPero en muchos casos, <strong>el coraz\u00f3n de diamante de la infraestructura permanece sin supervisi\u00f3n<\/strong>.<br \/>\nSe monitorizan con ojo de halc\u00f3n servidores, CPU, red, servicios&#8230; pero <strong>las GPUs siguen siendo el punto ciego m\u00e1s caro<\/strong>, que si dejas desatendido puede convertirse en un agujero en el bolsillo.<br \/>\nDe ah\u00ed que el verdadero reto no sea medir la GPU solamente, sino <strong>integrarla en la monitorizaci\u00f3n de infraestructuras on-premise, h\u00edbridas y cloud<\/strong>.<br \/>\nAqu\u00ed veremos c\u00f3mo.<\/p>\n<h2 id=\"1\">Qu\u00e9 es GPU monitoring o monitorizaci\u00f3n de Unidades de Procesamiento Gr\u00e1fico<\/h2>\n<p>El GPU monitoring es la supervisi\u00f3n continua del estado, uso, memoria, temperatura, consumo, disponibilidad y errores de las GPUs. Que dicho as\u00ed, suena a panel de control de nave estelar&#8230; y no andamos lejos.<br \/>\nEs obvio dada la introducci\u00f3n, pero para que quede claro, aqu\u00ed no hablamos de overclocking ni exprimir frames, sino de monitorizaci\u00f3n de recursos cr\u00edticos usados por cargas de IA, HPC o procesamiento intensivo, dentro de una estrategia profesional de <a href=\"https:\/\/pandorafms.com\/es\/it-topics\/monitorizacion-de-infraestructura\/\" target=\"_blank\" rel=\"noopener\">monitorizaci\u00f3n de infraestructura<\/A>.<\/p>\n<h2 id=\"2\">Por qu\u00e9 el GPU monitoring importa en infraestructuras de IA<\/h2>\n<p>Las GPUs sirven para acelerar las operaciones cr\u00edticas de una organizaci\u00f3n, pero como nada sale gratis en la vida, a cambio introducen riesgos operativos nuevos. Eso las convierte a la vez en el motor de cualquier proyecto IA y su tal\u00f3n de Aquiles.<br \/>\n\u00bfPor qu\u00e9?<\/p>\n<ul class=\"lista\">\n<li><strong>Porque son recursos (cada vez m\u00e1s) caros y limitados<\/strong>. Cada tarjeta inactiva o saturada, igual que cada minuto de downtime, es dinero y\u00e9ndose por el desag\u00fce.<\/li>\n<li><strong>La saturaci\u00f3n afecta a la inferencia y el entrenamiento<\/strong>. Una GPU que resopla al l\u00edmite ralentiza respuestas y alarga trabajos que, ya de por s\u00ed, tardan.<\/li>\n<li><strong>La falta de memoria provoca errores o degradaci\u00f3n<\/strong>. Un out of memory en mitad de un entrenamiento es la pantalla azul de la muerte de nuestros d\u00edas, solo que mucho m\u00e1s cara.<\/li>\n<li><strong>La temperatura impacta en el rendimiento y la disponibilidad<\/strong>, ya que, como pasa tambi\u00e9n con los humanos, el calor degrada y mucho calor apaga.<\/li>\n<li><strong>La infrautilizaci\u00f3n dificulta justificar la inversi\u00f3n<\/strong> y obliga a dar explicaciones cuando direcci\u00f3n mira la columna de gastos que ocupa tres hojas de papel continuo.<\/li>\n<li><strong>El hist\u00f3rico permite decidir sobre capacidad<\/strong>, pero la falta de visibilidad complica nuestra operaci\u00f3n con entornos h\u00edbridos, on-premise y cloud.<\/li>\n<\/ul>\n<p>La conclusi\u00f3n es que dejar a la GPU fuera de la foto de familia de la monitorizaci\u00f3n es una locura en estos tiempos que nos han tocado.<\/p>\n<h2 id=\"3\">El hueco real: GPU monitoring para entornos on-premise, h\u00edbridos y enterprise<\/h2>\n<p>Existe la creencia extendida de que la IA vive en la nube, en un centro de datos gestionado por otros y que devasta un ecosistema lejano al nuestro. Sin embargo, much\u00edsimas organizaciones operan GPUs en sus propios datacenters, en entornos h\u00edbridos, centros de investigaci\u00f3n, industria, instancias cloud con GPU&#8230;<br \/>\nY muchas de esas organizaciones <strong>operan bajo requisitos de confidencialidad, soberan\u00eda de datos o legislaciones sobre los mismos<\/strong> donde una soluci\u00f3n 100% nube no es viable, bajo pena de multa o riesgo de filtraciones peligrosas.<br \/>\nEn esos casos, no basta con instalar Ollama o similares y olvidarnos, ni la documentaci\u00f3n de turno de un proveedor cloud es suficiente para operar con garant\u00eda y eficiencia.<br \/>\nNecesitamos una plataforma capaz de <strong>vigilar todo, las GPUs y el resto de la infraestructura<\/strong> en conjunto, ya sea en <a href=\"https:\/\/pandorafms.com\/es\/monitorizacion-de-servidores\/\" target=\"_blank\" rel=\"noopener\">servidores propios<\/a> o <a href=\"https:\/\/pandorafms.com\/es\/monitorizacion-de-entornos-virtuales\/\" target=\"_blank\" rel=\"noopener\">entornos virtuales<\/A>.<br \/>\nEl debate que nunca termina entre <a href=\"https:\/\/pandorafms.com\/blog\/es\/on-premise-vs-saas-2025\/\" target=\"_blank\" rel=\"noopener\">on-premise y SaaS<\/a>, o los requerimientos de las <a href=\"https:\/\/pandorafms.com\/blog\/es\/monitorizacion-infraestructura-hiperconvergente\/\" target=\"_blank\" rel=\"noopener\">infraestructuras hiperconvergentes<\/a> refuerzan nuestra necesidad de control. Porque una GPU puede vivir on-premise, en un ecosistema h\u00edbrido o una instancia de nube, pero <strong>su impacto afecta a servicios, red, procesos, APIs, aplicaciones<\/strong>&#8230;.<br \/>\nDe ah\u00ed la necesidad de juntarse un poco para que la GPU quepa en esa foto de familia e <strong>incluirla en la monitorizaci\u00f3n global<\/strong>, no como una m\u00e9trica de verso suelto en una pesta\u00f1a que nadie abre.<br \/>\nY hablando de ellas&#8230;<\/p>\n<h2 id=\"4\">Las m\u00e9tricas clave en GPU monitoring<\/h2>\n<p>Debemos vigilar, vale, pero \u00bfqu\u00e9 exactamente?<br \/>\n<strong>Las m\u00e9tricas de una estrategia de GPU monitoring<\/Strong> que se precie de llamarse as\u00ed son (adem\u00e1s de su n\u00famero y nombres):<\/p>\n<ul class=\"lista\">\n<li><strong>Estatus de la GPU<\/strong> (su estado operativo).<\/li>\n<li><strong>Utilizaci\u00f3n de GPU<\/strong> (en porcentaje de uso).<\/li>\n<li><strong>Memoria de la GPU usada \/ libre \/ total <\/strong>(estado general de la memoria, tanto en bruto como en porcentaje).<\/li>\n<li><strong>Temperatura<\/strong> de la GPU para saber si el reactor de curvatura de la IA va a explotar o no.<\/li>\n<li><strong>Energ\u00eda que consume<\/strong> y l\u00edmite para evitar facturas como la capa de Superman.<\/li>\n<li><strong>Velocidad del ventilador<\/strong> cuando esto aplica, claro, como veremos enseguida.<\/li>\n<li><strong>Errores<\/strong> cr\u00edticos.<\/li>\n<li><strong>Versiones de driver<\/strong> NVIDIA y CUDA.<\/li>\n<\/ul>\n<p>Un par de matices porque en ellos se esconde lo que nos evitar\u00e1 disgustos.<br \/>\n<strong>Los errores cr\u00edticos no son una m\u00e9trica universal<\/strong>. En un centro de datos con soporte ECC, como las A100, H100, Tesla o RTX PRO, son relevantes, pero en las de nivel consumidor (como una GeForce RTX o similares), la utilidad de l\u00ednea de comandos de NVIDIA <span style=\"color:green; font-family:Pandocode;\">nvidia-smi<\/span> puede devolver N\/A para los errores ECC.<br \/>\nAs\u00ed, nuestro plugin de Pandora FMS, por ejemplo, emitir\u00e1 0 por dise\u00f1o. Ese eterno cero no significa que la tarjeta sea inmortal, simplemente, no hay nada que contar.<br \/>\nPor otro lado, la velocidad de ventilador <strong>solo tiene sentido en tarjetas con ventilaci\u00f3n activa<\/strong> (D&#8217;oh, que dir\u00eda Homer Simpson). En GPUs de servidor o entornos fanless no aplicar\u00eda, claro.<br \/>\nEs por eso que un plugin de monitorizaci\u00f3n como el nuestro permite omitir ese m\u00f3dulo con <span style=\"color:green; font-family:Pandocode;\">&#8211;include-fan=false<\/span>, ya que la <a href=\"https:\/\/pandorafms.com\/es\/it-topics\/telemetria-gestion-infraestructuras-pandora-fms\/\" target=\"_blank\" rel=\"noopener\">telemetr\u00eda avanzada<\/a> consiste tambi\u00e9n en saber qu\u00e9 no medir para no saturar con ruido.<\/p>\n<h2 id=\"5\">nvidia-smi, DCGM y plataformas de monitorizaci\u00f3n: qu\u00e9 aporta cada una<\/h2>\n<p>Ya hemos visto el qu\u00e9, <strong>ahora toca ver el c\u00f3mo monitorizamos<\/strong> y tambi\u00e9n diferenciar entre herramientas, porque se confunden con facilidad.<br \/>\nAnalicemos qu\u00e9 aporta cada una.<br \/>\nPor un lado tenemos <span style=\"font-family:Pandocode;\"><a href=\"https:\/\/docs.nvidia.com\/deploy\/nvidia-smi\/\" target=\"_blank\" rel=\"noopener nofollow\">nvidia-smi<\/A><\/span>, que ya ha asomado la patita y es <strong>la utilidad de l\u00ednea de comandos que permite consultar informaci\u00f3n de las GPUs NVIDIA<\/strong>. Hablamos de su utilizaci\u00f3n, memoria, temperatura, consumo, procesos, driver, <a href=\"https:\/\/docs.nvidia.com\/cuda\/\" target=\"_blank\" rel=\"noopener nofollow\">CUDA<\/A>\u2026<br \/>\nEste es el tricorder de la GPU, lo apuntas, lees una cifra y sigues tu camino. <strong>Perfecto para diagn\u00f3stico puntual o alg\u00fan script de madrugada<\/strong>.<br \/>\n<a href=\"https:\/\/developer.nvidia.com\/dcgm\" target=\"_blank\" rel=\"noopener nofollow\">NVIDIA DCGM<\/a> se orienta a la <strong>gesti\u00f3n de GPUs en centros de datos, clusters y despliegues avanzados<\/strong>. Aqu\u00ed ya tenemos sensores m\u00e1s amplios para nuestra nave espacial porque es \u00fatil cuando hay muchas GPUs o una integraci\u00f3n con stacks de observabilidad.<br \/>\nAmbas son buenas herramientas, pero la verdad es que <strong>ni <span style=\"color:green; font-family:Pandocode;\">nvidia-smi<\/span> ni DCGM nos van a resolver toda la operaci\u00f3n IT<\/strong>.<br \/>\nNo centralizan la infraestructura, no sustituyen dashboards corporativos, no aportan reporting hist\u00f3rico orientado a negocio y no correlacionan por su cuenta GPU con CPU, RAM, disco, red, logs, servicios o SLA, por ejemplo.<br \/>\nPor esos motivos, propuestas como la de <a href=\"https:\/\/www.datadoghq.com\/product\/gpu-monitoring\/\" target=\"_blank\" rel=\"noopener nofollow\">Datadog<\/a> insisten en conectar la GPU con el resto del AI workload.<br \/>\nO voy a expresarlo de otro modo para que se entienda. <span style=\"color:green; font-family:Pandocode;\">nvidia-smi<\/span> <strong>y DCGM pueden ser excelentes fuentes de datos, pero flotando solos en un vac\u00edo<\/strong>.<br \/>\nEs una plataforma, como <strong>Pandora FMS, la que los convierte en conocimiento accionable operacional<\/strong> con hist\u00f3rico, alertas, dashboards, informes, correlaci\u00f3n y decisiones de capacidad.<br \/>\nEl tricorder da una lectura, un puente de mando del Enterprise como Pandora FMS te dice qu\u00e9 significa en el contexto de todo lo dem\u00e1s cuando integra dicha lectura.<br \/>\nY en una crisis, quieres estar en el puente, no descifrando datos sueltos a oscuras.<\/p>\n<h2 id=\"6\">Los riesgos de no monitorizar GPUs<\/h2>\n<p>Dejar el motor desatendido tiene consecuencias desastrosas como:<\/p>\n<ul class=\"lista\">\n<li><strong>Saturaci\u00f3n invisible<\/strong>, de esa que solo se descubre cuando ya escuece.<\/li>\n<li><strong>Degradaci\u00f3n en servicios<\/strong>, de inferencia, entrenamientos m\u00e1s lentos o fallidos.<\/li>\n<li><strong>Errores CUDA<\/strong>, que pasan inadvertidos.<\/li>\n<li><strong>Sobrecalentamiento y facturas<\/strong>, de electricidad kilom\u00e9tricas.<\/li>\n<li><strong>Compra innecesaria<\/strong>, de hardware o <strong>,infrautilizaci\u00f3n<\/strong>, del ya pagado.<\/li>\n<li><strong>Dificultades para relacionar incidencias<\/strong>, de aplicaci\u00f3n con la presi\u00f3n real de la infraestructura.<\/li>\n<\/ul>\n<p>Es la trama de tantas pel\u00edculas de cat\u00e1strofes, las se\u00f1ales estaban ah\u00ed, parpadeando en alg\u00fan panel, pero nadie las miraba.<\/p>\n<h2 id=\"7\">De las m\u00e9tricas aisladas a la correlaci\u00f3n operativa<\/h2>\n<p>El GPU monitoring aislado es un term\u00f3metro que, con la <strong>correlaci\u00f3n operativa derivada de integrarlo en la monitorizaci\u00f3n global<\/strong>, se convierte en diagn\u00f3stico y conocimiento operativo.<br \/>\nSaber que una GPU est\u00e1 al 95% no dice gran cosa, como la fiebre por s\u00ed sola no revela su porqu\u00e9. <strong>Lo importante es el contexto<\/strong>.<br \/>\nSiguiendo el ejemplo, una GPU al 95% durante diez minutos puede ser normal, pero la misma GPU al 95% durante cuatro horas, con la memoria por encima del 85%, errores pintando los logs y la latencia de un servicio de inferencia subiendo es un <strong>incidente operativo<\/strong>.<br \/>\nOtro ejemplo es la temperatura. Una lectura alta junto a un ventilador corriendo a warp 9 y el rendimiento por los suelos puede anticipar un fallo f\u00edsico, una brecha en la muralla que derrumbar\u00e1 el castillo si se ignora.<br \/>\n<strong>Conectar esas se\u00f1ales es lo que distingue una herramienta que mira de una plataforma que entiende.<\/strong><br \/>\nEsa es la materia del <a href=\"https:\/\/pandorafms.com\/blog\/es\/analisis-causa-raiz\/\" target=\"_blank\" rel=\"noopener\">an\u00e1lisis de causa ra\u00edz<\/a>, del trabajo diario de cualquier <a href=\"https:\/\/pandorafms.com\/es\/it-topics\/network-operations-center\/\" target=\"_blank\" rel=\"noopener\">Network Operations Center<\/a> o equipo de <a href=\"hhttps:\/\/pandorafms.com\/es\/it-topics\/sre\/\" target=\"_blank\" rel=\"noopener\">SRE<\/a> que se tome en serio la <a href=\"https:\/\/pandorafms.com\/es\/it-topics\/monitorizacion-de-sistemas-ti\/\" target=\"_blank\" rel=\"noopener\">monitorizaci\u00f3n de sistemas TI<\/a>.<\/p>\n<h2 id=\"8\">C\u00f3mo ayuda Pandora FMS al GPU monitoring<\/h2>\n<p>En tecnolog\u00eda, o est\u00e1s en la punta de lanza o en realidad no est\u00e1s.<br \/>\nEsa es la filosof\u00eda en <a href=\"https:\/\/pandorafms.com\/\" target=\"_blank\" rel=\"noopener\">Pandora FMS<\/a> y por eso la aplicaci\u00f3n <strong>permite integrar las m\u00e9tricas de GPU<\/strong> en la misma consola donde ya se monitorizan servidores, servicios, red, almacenamiento, logs, eventos y disponibilidad.<br \/>\nEso hace que la vigilancia de GPUs no sea una nota a pie de p\u00e1gina, sino pieza fundamental de una maquinaria <strong>optimizada para la monitorizaci\u00f3n y observabilidad que necesita una infraestructura IT profesional<\/strong>.<br \/>\nPara ello, Pandora FMS usa <strong>un plugin especialista en GPU monitoring<\/strong>.<br \/>\nEste se apoya en <span style=\"color:green; font-family:Pandocode;\">nvidia-smi<\/Span> y funciona como plugin de agente local en el host con GPU NVIDIA, emitiendo m\u00f3dulos que Pandora FMS incorpora al contexto del agente.<br \/>\nAs\u00ed, esas m\u00e9tricas pueden:<\/p>\n<ul class=\"lista\">\n<li>Visualizarse, obviamente.<\/li>\n<li>Componer un hist\u00f3rico para tendencias, an\u00e1lisis o lo que sea necesario.<\/li>\n<li>Alertar de manera inteligente.<\/li>\n<li>Incluirse en informes como cualquier otra m\u00e9trica.<\/li>\n<\/ul>\n<p>Adem\u00e1s, esa informaci\u00f3n que emite es cr\u00edtica y la necesaria para la gesti\u00f3n \u00f3ptima de un activo m\u00e1s caro que el adamantium.<br \/>\nPor cada GPU detectada emite, entre otros: <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Status<\/span> (1 = sano, 0 = degradado), <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Utilization<\/span>, <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Memory_Used<\/span>, <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Memory_Free<\/span>, <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Memory_Total<\/Span> (en MiB, mebibytes, no en bytes), <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Memory_Used_Percent<\/Span>, <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Temperature<\/Span> (\u00b0C), <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Power_Draw<\/span> y <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Power_Limit<\/span> (W), <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Fan_Speed<\/Span> (omitible), <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Critical_Errors<\/span> y <span style=\"color:green; font-family:Pandocode;\">GPU_&lt;i>_Name<\/Span>.<br \/>\nA escala de host a\u00f1ade tres globales: <span style=\"color:green; font-family:Pandocode;\">GPU_Count<\/span>, <span style=\"color:green; font-family:Pandocode;\">GPU_Driver_Version<\/span> y <span style=\"color:green; font-family:Pandocode;\">GPU_CUDA_Version<\/span>.<br \/>\nLa cuenta total sale de una f\u00f3rmula sencilla: <span style=\"color:green; font-family:Pandocode;\"><strong>12N + 3<\/strong><\/span> m\u00f3dulos con fan speed, o <span style=\"color:green; font-family:Pandocode;\"><strong>11N + 3<\/strong><\/span> sin \u00e9l, donde N es el n\u00famero de GPUs del host.<br \/>\nY un detalle que revela mucho del dise\u00f1o. <strong>Si <span style=\"color:green; font-family:Pandocode;\">nvidia-smi<\/Span> no est\u00e1 disponible, no te preocupes, el plugin no se rompe ni produce un XML inv\u00e1lido<\/strong>, sino que emite <span style=\"color:green; font-family:Pandocode;\">GPU_Count = 0<\/span> en estado cr\u00edtico.<br \/>\nEl problema queda visible como una alerta limpia, no como ese silencio sospechoso que puede estar gestando la ruina.<br \/>\nNuestro objetivo (porque hemos vivido en carne propia el caos costoso de la fragmentaci\u00f3n), es que <strong>Pandora FMS permite analizar todas esas se\u00f1ales en la misma plataforma<\/strong>, con alertas integradas o nuestra metaconsola, por ejemplo, para tener un punto \u00fanico de visi\u00f3n y control, en lugar de saltar haciendo malabares entre comandos, logs y dashboards dispersos.<\/p>\n<h2 id=\"9\">Umbrales, alertas y estados cr\u00edticos<\/h2>\n<p>Pandora FMS est\u00e1 para evitar el desastre. Para ello, levanta hasta la \u00faltima alfombra y une los puntos para que tengas lo m\u00e1s parecido a la presciencia de los Atreides en Dune. De ah\u00ed su sistema de umbrales y alertas.<br \/>\nY para que podamos empezar enseguida y no lo hagamos de cero (una situaci\u00f3n que suele hacer que procrastinemos en lo importante), el plugin incluye umbrales predefinidos, disjuntos (que no se solapan) y acotados (con suelo y techo claro), en las m\u00e9tricas m\u00e1s sensibles:<\/p>\n<ul class=\"lista\">\n<li><span style=\"color:green; font-family:Pandocode;\"><strong>GPU_&lt;i>_Memory_Used_Percent<\/Strong><\/span> \u2014 Normal: 0-69 %. Warning: 70-84 %. Critical: 85-100 %.<\/li>\n<li><span style=\"color:green; font-family:Pandocode;\"><strong>GPU_&lt;i>_Temperature<\/Strong><\/span> \u2014 Normal: 0-69 \u00b0C. Warning: 70-89 \u00b0C. Critical: 90-110 \u00b0C.<\/li>\n<li><span style=\"color:green; font-family:Pandocode;\"><strong>GPU_&lt;i>_Critical_Errors<\/Strong><\/span> \u2014 Normal: 0. Critical: cualquier valor mayor que 0.<\/li>\n<\/ul>\n<p>Recordemos lo de que este error cr\u00edtico tiene sentido en tarjetas de datacenter con ECC, donde cualquier error no corregido debe tratarse como prioritario, sin t\u00e9rmino medio. En las GPUs para consumidores (y pobres) esto no aplica.<br \/>\nCon estos umbrales detectaremos presi\u00f3n de memoria, riesgo t\u00e9rmico y errores cr\u00edticos sin caer en el <a href=\"https:\/\/pandorafms.com\/blog\/es\/exceso-de-alertas-monitorizacion\/\" target=\"_blank\" rel=\"noopener\">exceso de alertas<\/A>, ese ruido que acaba haciendo que nadie haga caso a ninguna.<br \/>\nY si una organizaci\u00f3n necesita otros valores, genial. Creemos que cada organizaci\u00f3n es un mundo, as\u00ed que podemos ajustarlos a nuestra realidad concreta desde la propia consola.<\/p>\n<h2 id=\"10\">Compatibilidad y requisitos del plugin de Pandora FMS<\/h2>\n<p>\u00abPromesas que no valen nada&#8230;\u00bb, ya lo dice la canci\u00f3n. En Pandora FMS no nos gustan nada, as\u00ed que para evitar las que luego no se sostienen, <strong>conviene ser claros con lo que el plugin hace y lo que no<\/Strong>:<\/p>\n<ul class=\"lista\">\n<li>Este est\u00e1 orientado a <strong>GPUs NVIDIA<\/strong> y usa <span style=\"color:green; font-family:Pandocode;\">nvidia-smi<\/Span> como fuente de datos.<\/li>\n<li>Funciona como <strong>plugin de agente local<\/strong> y requiere el driver NVIDIA instalado y <span style=\"color:green; font-family:Pandocode;\">nvidia-smi<\/Span> disponible.<\/li>\n<li>Es <strong>compatible con Linux y Windows<\/strong>.<\/li>\n<li>En la nube funciona con instancias GPU de <a href=\"https:\/\/pandorafms.com\/es\/monitorizacion-amazon-web-services\/\" target=\"_blank\" rel=\"noopener\">AWS<\/a>, <a href=\"https:\/\/pandorafms.com\/es\/monitorizacion-de-microsoft-azure\/\" target=\"_blank\" rel=\"noopener\">Azure<\/a> o <a href=\"https:\/\/pandorafms.com\/es\/monitorizacion-google-cloud\/\" target=\"_blank\" rel=\"noopener\">Google Cloud<\/a> <strong>siempre que la GPU NVIDIA est\u00e9 expuesta al sistema operativo<\/strong> y el driver est\u00e9 correctamente instalado. Los proveedores documentan ese punto, como en las gu\u00edas de <a href=\"https:\/\/cloud.google.com\/compute\/docs\/gpus\/monitor-gpus\" target=\"_blank\" rel=\"noopener nofollow\">Google Cloud<\/A> o <a href=\"https:\/\/docs.aws.amazon.com\/dlami\/latest\/devguide\/tutorial-gpu-monitoring-gpumon.html\" target=\"_blank\" rel=\"noopener nofollow\">AWS<\/a>.<\/li>\n<li>Por el momento, <strong>no soporta AMD ni Intel<\/strong>.<\/li>\n<li>Tampoco monitoriza modelos de IA, prompts, drift ni m\u00e9tricas MLOps.<\/li>\n<li><strong>El intervalo recomendado del agente es de al menos 30 segundos<\/strong>, aunque el valor por defecto de 300 segundos resulta adecuado para la mayor\u00eda de entornos.<\/li>\n<\/ul>\n<p>Y un matiz operativo. <strong>El plugin est\u00e1 pensado para hosts individuales o entornos medianos<\/strong>.<br \/>\nSi en tu caso hablamos de clusters con muchas GPUs por nodo o arquitecturas Kubernetes a gran escala, puede ser necesario complementarlo con enfoques como DCGM, Prometheus u otras soluciones de agregaci\u00f3n.<br \/>\nNinguna herramienta lo es todo y reconocerlo nos parece lo honesto.<\/p>\n<h2 id=\"11\">GPU monitoring y planificaci\u00f3n de capacidad (capacity planning)<\/h2>\n<p>Teniendo en cuenta la cantidad de primog\u00e9nitos que debemos sacrificar al Dios M\u00e1quina para permitirnos una GPU, <strong>todo lo anterior est\u00e1 justificado de sobra<\/Strong>. O monitorizamos, o el punto m\u00e1s cr\u00edtico se convierte en punto ciego.<br \/>\nPero <strong>es en el capacity planning donde la monitorizaci\u00f3n se traduce en euros contantes y sonantes<\/strong>.<br \/>\nCon el hist\u00f3rico de utilizaci\u00f3n, memoria, temperatura y consumo se pueden detectar GPUs saturadas de forma recurrente, identificar las infrautilizadas, redistribuir cargas y justificar adquisiciones ante el departamento de compras con datos, en lugar de corazonadas y ruegos, ya que podremos medir el crecimiento real de la demanda.<br \/>\nAl final, es <a href=\"https:\/\/pandorafms.com\/es\/it-topics\/ciencia-de-datos-it\/\" target=\"_blank\" rel=\"noopener\">ciencia de datos aplicada a IT<\/a> y convertir el pasado en decisiones.<\/p>\n<h2 id=\"12\">La monitorizaci\u00f3n de GPU como parte de una monitorizaci\u00f3n de infraestructura IA (AI infrastructure monitoring)<\/h2>\n<p>Se suele hablar de GPUs porque en estos tiempos se han aupado a la cima de muchas infraestructuras IT, <strong>pero no juegan solas el partido<\/Strong>.<br \/>\nUna infraestructura IA depende tambi\u00e9n de CPU, RAM, disco, almacenamiento, red, APIs, servicios, logs, procesos, contenedores, bases de datos y la disponibilidad del conjunto.<br \/>\nPor eso, <strong>el GPU monitoring debe formar parte de una estrategia m\u00e1s amplia de AI infrastructure monitoring<\/strong>.<br \/>\nVigilar solo la GPU es como tripular el Enterprise atendiendo \u00fanicamente a lo que ocurre en el motor de antimateria, mientras se ignoran escudos, soporte vital o hasta el rumbo.<br \/>\nAh\u00ed es donde Pandora FMS se convierte en esa legendaria computadora de la nave que lo sab\u00eda todo.<br \/>\nPandora integra esa visibilidad en una operaci\u00f3n IT completa, en la que la <a href=\"https:\/\/pandorafms.com\/es\/ia-gestion-it-monitorizacion-inteligente\/\" target=\"_blank\" rel=\"noopener\">IA aplicada a la gesti\u00f3n<\/a>, la <a href=\"https:\/\/pandorafms.com\/es\/it-topics\/ia-generativa-gestion-it\/\" target=\"_blank\" rel=\"noopener\">IA generativa<\/a> y el <a href=\"https:\/\/pandorafms.com\/es\/it-topics\/deep-learning-monitorizacion-itsm\/\" target=\"_blank\" rel=\"noopener\">deep learning<\/a> aportan el an\u00e1lisis que (reconozc\u00e1moslo como especie) ning\u00fan humano podr\u00eda sostener a mano (ni ganas de hacerlo, porque tampoco hay necesidad).<br \/>\nEsto es relevante especialmente en los <a href=\"https:\/\/pandorafms.com\/blog\/es\/centros-de-datos-inteligentes-2\/\" target=\"_blank\" rel=\"noopener\">centros de datos<\/a>, donde la disponibilidad se da por descontada hasta que deja de estarlo, como bien sabe cualquier buena estrategia de <a href=\"https:\/\/pandorafms.com\/es\/it-topics\/monitorizacion-uptime\/\" target=\"_blank\" rel=\"noopener\">uptime monitoring<\/a>.<\/p>\n<h2 id=\"13\">Conclusi\u00f3n<\/h2>\n<p>Hemos comentado mucho, pero concentr\u00e9monos en tres ideas que llevarnos a casa.<\/p>\n<ul class=\"lista\">\n<li>Que <strong>las GPUs son recursos cr\u00edticos<\/Strong> en infraestructuras de IA y HPC, no un detalle t\u00e9cnico.<\/li>\n<li>Que<strong> monitorizarlas de forma aislada no es suficiente<\/Strong>, ya que una cifra sin contexto es ruido.<\/li>\n<li><strong>Que el valor est\u00e1 en integrarlas en la monitorizaci\u00f3n global de la infraestructura<\/Strong>, donde una m\u00e9trica de GPU dialoga con servidores, servicios, red, logs y alertas.<\/li>\n<\/ul>\n<p>Las herramientas de NVIDIA cantan la lectura, <Strong>pero hace falta un puente de mando que la interprete<\/Strong>.<br \/>\nPandora FMS aspira a ser ese puente para llevar el GPU monitoring a entornos on-premise, h\u00edbridos y enterprise. Porque entre los resquicios de IT viven los gremlins de la m\u00e1quina, <Strong>que te dan el disgusto en lo que no vigilas<\/Strong>.<\/p>\n<h2 id=\"14\">Preguntas frecuentes<\/h2>\n<p>Recopilemos las dudas m\u00e1s importantes sobre monitorizaci\u00f3n de GPU y sus respuestas.<\/p>\n<h4>\u00bfQu\u00e9 es GPU monitoring?<\/h4>\n<p>El GPU monitoring es <strong>la supervisi\u00f3n continua del estado, utilizaci\u00f3n, memoria, temperatura, consumo y errores de las Unidades de Procesamiento Gr\u00e1fico en entornos profesionales<\/Strong>.<br \/>\nSe usa para controlar GPUs empleadas en IA, HPC, inferencia, entrenamiento de modelos o procesamiento intensivo.<br \/>\nComo he comentado al principio, no debe confundirse con herramientas de gaming, overclocking o tuning gr\u00e1fico.<\/p>\n<h4>\u00bfPor qu\u00e9 es importante monitorizar GPUs en infraestructuras de IA?<\/h4>\n<p>Porque las GPUs son lo que hace latir el coraz\u00f3n y, adem\u00e1s, <Strong>recursos muy caros y cr\u00edticos<\/Strong> para cargas de inferencia, entrenamiento y machine learning.<br \/>\n<Strong>Sin monitorizaci\u00f3n, estamos ciegos en nuestro activo m\u00e1s cr\u00edtico<\/Strong>, dej\u00e1ndolo indefenso ante la saturaci\u00f3n, el sobrecalentamiento, los errores o la infrautilizaci\u00f3n, que tienen la man\u00eda de atacar escondidos en las sombras y huecos que dejamos sin vigilar.<br \/>\nEsto aumenta el riesgo operativo y dificulta que nos aprueben nuevas inversiones en hardware desde el departamento financiero.<\/p>\n<h4>\u00bfQu\u00e9 m\u00e9tricas deben monitorizarse en una GPU?<\/h4>\n<p>Las principales son utilizaci\u00f3n, memoria usada, libre y total, porcentaje de memoria utilizada, temperatura, consumo instant\u00e1neo, l\u00edmite de consumo, velocidad de ventilador, estado, errores cr\u00edticos ECC, modelo de GPU, versi\u00f3n de driver y versi\u00f3n CUDA.<br \/>\nCasi nada, pero eso s\u00ed, aisladas tendremos un puzzle sin montar, as\u00ed que <Strong>en entornos profesionales, estas m\u00e9tricas deben analizarse junto al resto<\/Strong> de la infraestructura.<\/p>\n<h4>\u00bfQu\u00e9 diferencia hay entre nvidia-smi, DCGM y una plataforma de monitorizaci\u00f3n?<\/h4>\n<p><span style=\"color:green; font-family:Pandocode;\">nvidia-smi<\/span> es una utilidad de l\u00ednea de comandos para consultar m\u00e9tricas puntuales de GPUs NVIDIA.<br \/>\nDCGM se orienta a la gesti\u00f3n y monitorizaci\u00f3n de GPUs en datacenters y clusters.<br \/>\nUna plataforma como Pandora FMS <Strong>centraliza esas m\u00e9tricas junto al resto de la infraestructura<\/Strong>, con hist\u00f3rico, alertas, dashboards e informes.<\/p>\n<h4>\u00bfA qu\u00e9 temperatura se considera cr\u00edtica una GPU de servidor?<\/h4>\n<p>Por nuestra experiencia volcada en el plugin de GPU monitoring de Pandora FMS, <Strong>una temperatura a partir de 70 \u00b0C se considera advertencia y a partir de 90 \u00b0C, cr\u00edtica<\/Strong>.<br \/>\nEstos umbrales sirven como referencia operativa, aunque pueden variar seg\u00fan el modelo de GPU, el fabricante y las condiciones t\u00e9rmicas del entorno.<\/p>\n<h4>\u00bfQu\u00e9 son los errores ECC en una GPU y por qu\u00e9 importan?<\/h4>\n<p>Los errores ECC (Error-Correcting Code) son <Strong>errores de memoria detectados en GPUs con soporte ECC<\/Strong>.<br \/>\nLos no corregidos pueden indicar fallos de hardware y deben tratarse como incidentes cr\u00edticos.<br \/>\nSon especialmente relevantes en GPUs de datacenter como A100, H100, Tesla o RTX PRO. En GPUs de nivel consumidor el m\u00f3dulo se emite igual, pero con valor 0 en el plugin de Pandora FMS, porque no hay errores ECC que contar.<\/p>\n<h4>\u00bfSe pueden monitorizar GPUs en entornos on-premise con Pandora FMS?<\/h4>\n<p>S\u00ed. <Strong>Pandora FMS dispone de un plugin de agente local basado en <span style=\"color:green; font-family:Pandocode;\">nvidia-smi<\/span> que permite monitorizar GPUs NVIDIA en servidores on-premise<\/Strong>.<br \/>\nTambi\u00e9n puede usarse en entornos h\u00edbridos o instancias de nube si la GPU NVIDIA est\u00e1 expuesta al sistema operativo y el driver est\u00e1 correctamente instalado.<\/p>\n<h4>\u00bfC\u00f3mo ayuda el GPU monitoring al capacity planning?<\/h4>\n<p>El hist\u00f3rico de utilizaci\u00f3n, memoria, temperatura y consumo permite identificar <Strong>GPUs saturadas de forma recurrente, detectar infrautilizaci\u00f3n y redistribuir<\/Strong> cargas.<br \/>\nTambi\u00e9n <Strong>ayuda a justificar compras de hardware<\/Strong> o posponer ampliaciones innecesarias con datos objetivos de uso y capacidad en la mano.<\/p>\n<h4>\u00bfQu\u00e9 ocurre si nvidia-smi no est\u00e1 instalado en el servidor?<\/h4>\n<p>Si<span style=\"color:green; font-family:Pandocode;\"> nvidia-smi<\/span> no est\u00e1 disponible, el plugin de Pandora FMS emite el m\u00f3dulo <span style=\"color:green; font-family:Pandocode;\">GPU_Count<\/span> con valor 0 en estado cr\u00edtico.<br \/>\nEsto <Strong>permite generar una alerta sin romper la ejecuci\u00f3n del agente ni producir XML inv\u00e1lido<\/Strong>.<br \/>\nEl problema queda visible como ausencia de GPU o fallo en la disponibilidad de la fuente de datos.<\/p>\n<h4>\u00bfEl GPU monitoring es suficiente para gestionar una infraestructura de IA?<\/h4>\n<p><Strong>No<\/Strong>. Es una parte de un todo m\u00e1s amplio.<br \/>\nLa GPU es componente cr\u00edtico, pero <Strong>una infraestructura de IA tambi\u00e9n depende de CPU, RAM, almacenamiento<\/Strong>, red, servicios&#8230;<br \/>\nPor eso el GPU monitoring debe integrarse en una estrategia m\u00e1s amplia de AI infrastructure monitoring. Sin eso, ser\u00e1 imposible que tengamos una visi\u00f3n operativa completa.[\/et_pb_text][et_pb_button button_url=\u00bb@ET-DC@eyJkeW5hbWljIjp0cnVlLCJjb250ZW50IjoicG9zdF9saW5rX3VybF9wYWdlIiwic2V0dGluZ3MiOnsicG9zdF9pZCI6IjM2MjI3MCJ9fQ==@\u00bb button_text=\u00bb\u2190 Regresar a IT Topics\u00bb button_alignment=\u00bbleft\u00bb _builder_version=\u00bb4.22.0&#8243; _dynamic_attributes=\u00bbbutton_url\u00bb _module_preset=\u00bbdefault\u00bb custom_button=\u00bbon\u00bb button_text_size=\u00bb1em\u00bb button_text_color=\u00bb#0C312F\u00bb button_bg_color=\u00bb#FFFFFF\u00bb button_bg_color_gradient_direction=\u00bb90deg\u00bb button_bg_color_gradient_stops=\u00bb#82B92E 0%|#3CB92E 100%\u00bb button_bg_color_gradient_start=\u00bb#82B92E\u00bb button_bg_color_gradient_end=\u00bb#3CB92E\u00bb button_border_width=\u00bb1px\u00bb button_border_color=\u00bb#eaeaea\u00bb button_border_radius=\u00bb100px\u00bb button_use_icon=\u00bboff\u00bb z_index=\u00bb0&#8243; custom_margin=\u00bb60px||0px||false|false\u00bb custom_padding=\u00bb10px|50px|10px|50px|true|true\u00bb custom_padding_tablet=\u00bb\u00bb custom_padding_phone=\u00bb10px|20px|10px|20px|true|true\u00bb custom_padding_last_edited=\u00bbon|phone\u00bb custom_css_main_element=\u00bbright:0!important;||font-family:%22Pandora-Bold%22!important;\u00bb global_module=\u00bb367749&#8243; locked=\u00bboff\u00bb global_colors_info=\u00bb{}\u00bb button_bg_color__hover_enabled=\u00bbon|desktop\u00bb button_bg_color_gradient_start__hover=\u00bb#eaeaea\u00bb button_bg_color_gradient_end__hover=\u00bb#f4f4f4&#8243; button_bg_color__hover=\u00bb#eaeaea\u00bb button_bg_enable_color__hover=\u00bbon\u00bb button_bg_use_color_gradient__hover=\u00bbon\u00bb button_bg_color_gradient_stops__hover=\u00bb#eaeaea 0%|#f4f4f4 100%\u00bb][\/et_pb_button][\/et_pb_column][\/et_pb_row][\/et_pb_section][et_pb_section fb_built=\u00bb1&#8243; custom_padding_last_edited=\u00bbon|desktop\u00bb admin_label=\u00bbFinal CTA\u00bb _builder_version=\u00bb4.27.0&#8243; _module_preset=\u00bbdefault\u00bb background_color=\u00bb#161327&#8243; use_background_color_gradient=\u00bbon\u00bb background_color_gradient_stops=\u00bbrgba(22,19,39,0.5) 17%|rgba(22,19,39,0.5) 100%\u00bb background_color_gradient_overlays_image=\u00bbon\u00bb background_image=\u00bbhttps:\/\/pandorafms.com\/wp-content\/uploads\/2023\/12\/banner-contacta-it-topics.webp\u00bb background_size=\u00bbcustom\u00bb background_image_width=\u00bb121%\u00bb background_image_height=\u00bb192%\u00bb background_position=\u00bbtop_left\u00bb z_index=\u00bb1&#8243; max_width=\u00bb1080px\u00bb max_width_tablet=\u00bb98%\u00bb max_width_phone=\u00bb98%\u00bb max_width_last_edited=\u00bbon|tablet\u00bb module_alignment=\u00bbcenter\u00bb custom_margin=\u00bb80px||80px||true|false\u00bb custom_padding=\u00bb40px|20px|120px|20px|false|true\u00bb custom_padding_tablet=\u00bb40px|0px|120px|0px|false|true\u00bb custom_padding_phone=\u00bb40px|0px|120px|0px|false|true\u00bb scroll_scaling=\u00bb40|55|85|100|100%|120%|100%\u00bb motion_trigger_start=\u00bbtop\u00bb background_last_edited=\u00bbon|phone\u00bb background_size_tablet=\u00bbcover\u00bb background_size_phone=\u00bbcover\u00bb background_position_phone=\u00bbtop_center\u00bb border_radii=\u00bboff|20px|20px|20px|20px\u00bb border_color_all=\u00bb#ffffff\u00bb box_shadow_style=\u00bbpreset1&#8243; box_shadow_vertical=\u00bb0px\u00bb box_shadow_blur=\u00bb80px\u00bb box_shadow_color=\u00bb#506da0&#8243; global_module=\u00bb367449&#8243; saved_tabs=\u00bball\u00bb global_colors_info=\u00bb{}\u00bb][et_pb_row use_custom_gutter=\u00bbon\u00bb gutter_width=\u00bb2&#8243; make_equal=\u00bbon\u00bb _builder_version=\u00bb4.22.0&#8243; _module_preset=\u00bbdefault\u00bb max_width=\u00bb750px\u00bb module_alignment=\u00bbcenter\u00bb custom_margin=\u00bb0px||0px||true|false\u00bb custom_padding=\u00bb0px|0px|0px|0px|true|true\u00bb global_colors_info=\u00bb{}\u00bb][et_pb_column type=\u00bb4_4&#8243; _builder_version=\u00bb4.22.0&#8243; _module_preset=\u00bbdefault\u00bb global_colors_info=\u00bb{}\u00bb][et_pb_text content_tablet=\u00bb<\/p>\n<p class=%22h2-w%22>Habla con el equipo de ventas, pide presupuesto, o resuelve tus dudas sobre nuestras licencias<\/p>\n<p>\u00bb content_phone=\u00bb<\/p>\n<p class=%22h2-w%22>Habla con el equipo de ventas, resuelve tus dudas sobre nuestras licencias o pide presupuesto<\/p>\n<p>\u00bb content_last_edited=\u00bbon|tablet\u00bb _builder_version=\u00bb4.22.0&#8243; _module_preset=\u00bbdefault\u00bb header_2_font_size=\u00bb2em\u00bb text_orientation=\u00bbcenter\u00bb module_alignment=\u00bbleft\u00bb custom_margin=\u00bb0px||20px||false|false\u00bb custom_padding=\u00bb0px||0px||true|false\u00bb global_colors_info=\u00bb{}\u00bb]<\/p>\n<p class=\"h2-w\">Habla con el equipo de ventas, pide presupuesto, <br \/>o resuelve tus dudas sobre nuestras licencias<\/p>\n<p>[\/et_pb_text][et_pb_code _builder_version=\u00bb4.27.4&#8243; _module_preset=\u00bbdefault\u00bb width=\u00bb200px\u00bb module_alignment=\u00bbcenter\u00bb custom_margin=\u00bb40px||0px||false|false\u00bb custom_padding=\u00bb0px||0px||true|false\u00bb locked=\u00bboff\u00bb global_colors_info=\u00bb{}\u00bb]<\/p>\n<div class=\"doblebtn\"><!-- [et_pb_line_break_holder] --><a class=\"prices-2024-btn\" style=\"padding:10px 30px!important\" href=\"https:\/\/pandorafms.com\/es\/contactar\/\">\u00a1Contacta ahora!<\/a><\/div>\n<p>[\/et_pb_code][\/et_pb_column][\/et_pb_row][\/et_pb_section]<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Secciones Qu\u00e9 es GPU monitoring Por qu\u00e9 el GPU monitoring importa Entornos on-premise, h\u00edbridos y enterprise Las m\u00e9tricas clave en GPU monitoring nvidia-smi, DCGM y plataformas de monitorizaci\u00f3n Los riesgos de no monitorizar GPUs De las m\u00e9tricas aisladas a la correlaci\u00f3n operativa C\u00f3mo ayuda Pandora FMS al GPU monitoring Umbrales, alertas y estados cr\u00edticos C\u00f3mo [&hellip;]<\/p>\n","protected":false},"author":33,"featured_media":424579,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"on","_et_pb_old_content":"","_et_gb_content_width":"","_joinchat":[],"footnotes":""},"categories":[3506,7757],"tags":[],"class_list":["post-424567","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-it-topics","category-monitorizacion"],"_links":{"self":[{"href":"https:\/\/pandorafms.com\/es\/wp-json\/wp\/v2\/posts\/424567","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/pandorafms.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/pandorafms.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/pandorafms.com\/es\/wp-json\/wp\/v2\/users\/33"}],"replies":[{"embeddable":true,"href":"https:\/\/pandorafms.com\/es\/wp-json\/wp\/v2\/comments?post=424567"}],"version-history":[{"count":11,"href":"https:\/\/pandorafms.com\/es\/wp-json\/wp\/v2\/posts\/424567\/revisions"}],"predecessor-version":[{"id":424599,"href":"https:\/\/pandorafms.com\/es\/wp-json\/wp\/v2\/posts\/424567\/revisions\/424599"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/pandorafms.com\/es\/wp-json\/wp\/v2\/media\/424579"}],"wp:attachment":[{"href":"https:\/\/pandorafms.com\/es\/wp-json\/wp\/v2\/media?parent=424567"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/pandorafms.com\/es\/wp-json\/wp\/v2\/categories?post=424567"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/pandorafms.com\/es\/wp-json\/wp\/v2\/tags?post=424567"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}