Skip to main content

Módulos generados por el plugin

Cada GPU i (0-indexado) genera los siguientes módulos:

Módulo Tipo Unidad Descripción
GPU_<i>_Status generic_proc - 1 si la GPU está detectada, 0 si no
GPU_<i>_Utilization generic_data % Utilización de cómputo de la GPU
GPU_<i>_Throttle_Active generic_data - Bitmask de razones de throttling activas
GPU_<i>_Throttle_Reasons generic_data_string - Etiquetas de throttling separadas por coma
GPU_<i>_Memory_Controller_Utilization generic_data % Utilización del controlador de memoria
GPU_<i>_Memory_Used generic_data MiB Memoria usada
GPU_<i>_Memory_Free generic_data MiB Memoria libre
GPU_<i>_Memory_Total generic_data MiB Memoria total
GPU_<i>_Memory_Used_Percent generic_data % (usada/total) * 100 redondeado a 1 decimal
GPU_<i>_Temperature generic_data °C Temperatura de la GPU
GPU_<i>_Power_Draw generic_data W Consumo actual de energía
GPU_<i>_Power_Limit generic_data W Límite de energía
GPU_<i>_Fan_Speed generic_data % Velocidad del ventilador (omitido con --include-fan=false)
GPU_<i>_Graphics_Clock generic_data MHz Frecuencia del reloj de gráficos
GPU_<i>_Performance_State generic_data_string - Etiqueta del estado de rendimiento (ej: P0)
GPU_<i>_Performance_State_Number generic_data PNumber Valor numérico del estado de rendimiento
GPU_<i>_Critical_Errors generic_data - Conteo de errores ECC no corregidos
GPU_<i>_Name generic_data_string - Nombre del modelo de GPU

Módulos globales (3 total)

Módulo Tipo Descripción
GPU_Count generic_proc Número de GPUs detectadas (0 = CRITICAL)
GPU_Driver_Version generic_data_string Versión del driver NVIDIA
GPU_CUDA_Version generic_data_string Versión máxima de CUDA soportada

Política de thresholds

Módulo Normal Warning Critical
Temperature [0, 69] [70, 89] [90, 110]
Memory_Used_Percent [0, 69] [70, 84] [85, 100]
Critical_Errors 0 (ninguno) [1, 1000000]

Los thresholds están hardcodeados en el binario. Para modificarlos, usar plantillas de alerta en la consola de Pandora FMS.

Grupos de módulos

  • Todos los módulos por GPU usan module_group=GPU
  • Los módulos globales (GPU_Count, GPU_Driver_Version, GPU_CUDA_Version) no tienen module_group