Azure Microsoft Compute

Este documento describe la funcionalidad Azure Microsoft Compute del discovery de PandoraFMS.

Introducción

Este plugin tiene como finalidad monitorizar intancias y regiones de Azure Microsoft Compute, mediante métricas claves referentes al CPU, redes, IOPS y discos que son esenciales para llevar un control y seguimiento de estas máquinas y para garantizar un rendimiento óptimo, solucionar problemas, planificar el escalado, cumplir con los SLAs y mejorar la seguridad. 

El plugin se conecta al API de Azure y monitoriza zonas e instancias mediante las métricas anteriormente mencionadas, generando un agente para cada zona e instancia via XML que envía al servidor de pandora.

Matriz de compatibilidad

 

Sistemas donde se ha probado Rocky linux, Fedora 34
Sistemas donde funciona Cualquier sistema linux

Prerrequisitos

El plugin es un binario que contiene las dependencias empaquetadas por lo que no es necesaria la instalación de ningún tipo de dependencia para su uso.

Para hacer las solicitudes a través de la api, la cuenta utilizada para autenticar en la ejecución requiere de unos determinados permisos.

Asignación de permisos

Debe asignar un rol a la cuenta con la que vaya a operar la app, para ello acceda a Home y entre en Suscription:

image-1687444674025.png

Dentro de la suscripción, seleccione Access control (IAM):

image-1687444709078.png

Se agregará una nueva asignación de rol en la debe seleccionar Reader para la app creada:

image-1687444741413.png

Guarde los cambios pulsando Save .

A partir de ese momento podrá conectar con el servicio y hacer solicitudes a través de este plugin.

 

Parámetros y configuración

Parámetros

--conf Ruta al archivo de configuración
Archivo de configuración (--conf)
agents_group_name  = < Nombre del grupo de destino para los agentes creados >
threads            = < Número de hilos de ejecución, cada zona/instancia se repartirá equitativamente en el número de hilos >
interval           = < Intervalo en segundos para los agentes y para el analisis de métricas >
transfer_mode      = < Modo de transferencia, tentacle o local >
tentacle_ip        = < IP de la máquina destino para los agentes creados >
tentacle_port      = < Puerto de tentacle, por defecto : 41121 >
tentacle_opts      = < Opciones adicionales de tentacle client >
data_dir           = < (Solo se activa si el transfer_mode es local) Ruta de destino para los XML de cada agente, por defecto "/var/spool/pandora/data_in/" >

advance_monitoring = < Activar con 1 para habilitar monitorización generalizada (estos módulos solo se crearán en los agentes de las instancias que esten en ejecución) >
cpu_summary        = < Activar con 1 para habilitar la monitorización del CPU >
iops_summary       = < Activar con 1 para habilitar la monitorización IOPS  >
disk_summary       = < Activar con 1 para habilitar la monitorización de discos >
network_summary    = < Activar con 1 para habilitar la monitorización de redes  >

stats_agent        = < Activar con 1 para habilitar un agente global que monitorizará en base a la tarea creada y los parámetros utilizados >
stats_agent_name   = < Nombre para el agente que se activa con el parámetro "stats_agent". Si no utiliza y "stats_agent" esta habilitado, el agente se llamará "azure" por defecto > >

azure_zones          = < Lista con las zonas a monitorizar (cuando se marca una zona para monitorizar, automaticamente monitoriza todas las instancias que encuentre dentro de esa zona) >
azure_instances =    = < Lista con las instancias a monitorizar >

creds_b64 = < Credenciales en base64 del archivo JSON para autenticar >

Ejemplo

agents_group_name  = azure
interval           = 3600
threads            = 5
transfer_mode      = tentacle
tentacle_client    = tentacle_client
tentacle_ip        = 172.42.42.101
tentacle_port      = 41121
data_dir           = /var/spool/pandora/data_in/

advance_monitoring = 1
cpu_summary        = 1
iops_summary       = 1
disk_summary       = 1
network_summary    = 1

stats_agent        = 1
stats_agent_name   = azureCloud

azure_zones = ["uksouth","ukwest"]
azure_instances = ["instance-1","instance-2","instance-3",instance-4"]


creds_b64 = oiZJDNNJKCDJndkdKDNJDKDKNDhjdkdmdNHFJFKfFMFNFJFKk5IinDJFJKFKfmnfDHHDKDKDldjjDfmFJFNFFMNFNFMFNFmFNFFJJFmf==

Ejecución manual

El formato de la ejecución del plugin es el siguiente:

./pandora_azure_mc --conf < ruta al fichero de configuración >

Por ejemplo:

./pandora_azure_mc --conf /usr/share/pandora_server/util/plugin/azure.conf

La ejecución devolverá una salida en formato JSON con información sobre la ejecución, y generará un fichero XML para cada agente monitorizado que enviará al servidor de Pandora FMS por el método de transferencia indicado en la configuración.

Por ejemplo:

{"summary": {"Total agents": 35, "Zones agents": 5, "Instances agents": 29}}

Discovery

Este plugin puede integrarse con el Discovery de Pandora FMS.

Para ello se debe cargar el paquete ".disco" que puede descargar desde la librería de Pandora FMS:

https://pandorafms.com/library/

image-1687944710118.png

Una vez cargado, se podrán monitorizar entornos de Azure Microsoft Compute creando tareas de Discovery desde la sección Management > Discovery > Cloud.

image-1687944813607.png

Para cada tarea se solicitarán los siguientes datos mínimos:

image-1687441745735.png

Si las credenciales proporcionadas son correctas y el servidor de Pandora FMS es capaz de conectar con el API de Microsfot Azure, se podrá ver un árbol con las zonas e instancias de Azure Microsoft Compute, las cuales se podrán marcar para su monitorización.

Si se selecciona una zona se monitorizarán, además de la propia zona, todas las instancias que contenga (tanto en el momento de configurar la tarea como en adelante si se incluyen nuevas instancias).

Si se seleccionan instancias específicas se monitorizarán independientemente de que no se hayan seleccionado sus zonas.

image-1687441086213.png

Finalmente se podrá ajustar la monitorización que se desee obtener para cada agente:

image-1687441126549.png

Las tareas que se completen exitosamente dispondrán de un sumario de ejecución con la siguiente información:

image-1687441167730.png

Las tareas que no se completen exitosamente dispondrán de un sumario de ejecución registrando los errores producidos.

Agentes y módulos generados por el plugin

La ejecución del plugin, creara los siguientes agentes y módulos:

< Nombre utilizado con el parámetro "stats_agent_name" o en su defecto "azure" >

Módulos

Azure MC Instances count
Número de instancias totales monitorizadas por el plugin

 

< Nombre de la zona >

Módulos

summary.azure.compute.CPUUtilization Porcentaje de CPU usado promedio de las instancias de esta zona
summary.azure.compute.DiskReadBytes Sumario de la cantidad de bytes leídos desde el disco de cada instancia de esta zona
summary.azure.compute.DiskReadOps  Sumario de el número de operaciones de lectura realizadas en el disco de cada instancia de esta zona
summary.azure.compute.diskWriteBytes  Sumario de la cantidad de bytes escritos en el disco de cada instancia de esta zona
summary.azure.compute.DiskWriteOps  Sumario del número de operaciones de escritura realizadas en el disco de cada instancia de esta zona
summary.azure.compute.instances Número de instancias monitorizadas en esta zona
summary.azure.compute.NetworkPacketsIn  Sumario del número de paquetes de red entrantes de cada instancia de esta zona
summary.azure.compute.NetworkPacketsOut  Sumario del número de paquetes de red salientes de cada instancia de esta zona
< Nombre del grupo de recursos >/< Nombre de la instancia >

Módulos

State Estado de la máquina, en formato string
Instance State (bool) Estado de la máquina, 1 si esta corriendo, 0 de no ser este el caso
CPUUtilization Porcentaje de uso de CPU utilizado
DiskReadBytes Cantidad de bytes leídos desde el disco
DiskReadOps El número de operaciones de lectura realizadas en el disco
DiskWriteBytes Cantidad de bytes escritos en el disco
DiskWriteOps Número de operaciones de escritura realizadas en el disco
NetworkPacketsIn El número de paquetes de red entrantes
NetworkPacketsOut El número de paquetes de red salientes