Diferencias
Muestra las diferencias entre dos versiones de la página.
Próxima revisión | Revisión previa Próxima revisión Ambos lados, revisión siguiente | ||
es:documentation:03_monitoring:07_services [2021/04/17 10:56] 0.0.0.0 created |
es:documentation:03_monitoring:07_services [2021/06/21 23:14] jimmy.olano [Modo Smart] Enlaces externos interwiki. |
||
---|---|---|---|
Línea 1: | Línea 1: | ||
+ | ====== Monitorización de servicios ====== | ||
+ | |||
+ | {{indexmenu_n> | ||
+ | |||
+ | [[: | ||
+ | |||
+ | ===== Monitorización de Servicios ===== | ||
+ | |||
+ | <WRAP center round tip 60%> {{: | ||
+ | |||
+ | ==== Introducción ==== | ||
+ | |||
+ | Un **Servicio** en Pandora FMS es una agrupación de recursos de Tecnología de Información (// | ||
+ | |||
+ | Un Servicio puede ser, por ejemplo, el sitio web oficial de la empresa, el //Customer Relationship Management// | ||
+ | |||
+ | Pandora FMS representa los Servicios como una agrupación de elementos monitorizados ([[: | ||
+ | |||
+ | ==== Servicios en Pandora FMS ==== | ||
+ | |||
+ | La [[: | ||
+ | |||
+ | De esta manera la monitorización de Servicios permite comprobar el estado de un Servicio global. Se puede conocer si un servicio se está proporcionando con normalidad (verde), degradado (amarillo) o si no está prestando el servicio (rojo). | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Las monitorizaciones de Servicios están representados bajo tres conceptos: de manera simple, por sus //pesos de importancia// | ||
+ | === Cómo funciona el modo simple === | ||
+ | |||
+ | En este modo solo es necesario indicar qué elementos son críticos y cuáles no. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Solo los elementos marcados como críticos serán tenidos en cuenta para realizar los cálculos y solo el estado '' | ||
+ | |||
+ | * Cuando entre 0 y el 50% de los elementos críticos se encuentre en estado '' | ||
+ | * //Cuando más// | ||
+ | Ejemplo: | ||
+ | |||
+ | * Router es un elemento **crítico**. | ||
+ | * Impresora es un elemento **no crítico**. | ||
+ | * Servidor Apache Web es un elemento **crítico**. | ||
+ | |||
+ | Situación 1: | ||
+ | |||
+ | * Router, estado '' | ||
+ | * Impresora, estado '' | ||
+ | * Servidor Apache, estado '' | ||
+ | |||
+ | **Resultado**: | ||
+ | |||
+ | Situación 2: | ||
+ | |||
+ | * Router, estado '' | ||
+ | * Impresora, estado '' | ||
+ | * Servidor Apache, estado '' | ||
+ | |||
+ | **Resultado**: | ||
+ | |||
+ | Situación 3: | ||
+ | |||
+ | * Router, estado '' | ||
+ | * Impresora, estado '' | ||
+ | * Servidor Apache, estado '' | ||
+ | |||
+ | **Resultado**: | ||
+ | |||
+ | === Cómo funcionan los servicios según su peso === | ||
+ | |||
+ | La necesidad de monitorizar Servicios como algo " | ||
+ | |||
+ | **¿Qué pasa con mi aplicación si se cae un elemento que en principio no es crítico?** | ||
+ | |||
+ | Para solventar todas estas dudas, en Pandora FMS aparece la funcionalidad de monitorización a través de Servicios que ayuda a: | ||
+ | |||
+ | * Limitar la cantidad de avisos recibidos. Se recibirán alertas sobre situaciones que comprometen la fiabilidad de los servicios que provee la empresa o ente. | ||
+ | * Poder llevar un seguimiento del nivel de cumplimiento (en inglés // | ||
+ | * Simplificar la visualización de la monitorización de la infraestructura. | ||
+ | |||
+ | Para lograr esto, se debe tener monitorizado cada elemento que pueda afectar negativamente a nuestra aplicación. | ||
+ | |||
+ | A través de la Consola de Pandora FMS, se debe definir un **Árbol de Servicio** | ||
+ | |||
+ | Todos los elementos que añadamos a los árboles de servicio corresponderán a información que ya está siendo monitorizada, | ||
+ | |||
+ | Para indicar el grado en que afectan los estados de cada elemento al estado global, se utilizará un sistema de **suma de pesos**, de modo que los más importantes (con más peso) serán más relevantes para ajustar el estado global del servicio completo a un estado incorrecto antes que los elementos menos importantes (con menos peso). | ||
+ | |||
+ | == Ejemplo == | ||
+ | |||
+ | Se debe monitorizar una aplicación web que está balanceada a través de una serie de elementos redundantes. La infraestructura en la que se basa la aplicación está formada en este ejemplo por los siguientes elementos: | ||
+ | |||
+ | * Dos // | ||
+ | * Dos // | ||
+ | * Veinte servidores Web Apache®. | ||
+ | * Cuatro servidores de Aplicaciones WebLogic®. | ||
+ | * Un // | ||
+ | |||
+ | El objetivo es saber si la aplicación web está funcionando correctamente, | ||
+ | |||
+ | Si estuviera fuera de línea uno de los veinte servidores Apache, debido a tanta redundancia ¿es prudente avisar, alertar a todo el personal? //¿Cuál es la regla para alertar?// | ||
+ | |||
+ | De manera advenediza se pudiera concluir que Pandora FMS sólo debería avisar si falla un elemento muy crítico (por ejemplo un //router//) o si varios servidores Apache están fuera de línea al mismo tiempo… ¿pero cuántos de ellos? Para solucionar esto se debe asignar unos valores de peso a la lista de componentes descritos anteriormente: | ||
+ | |||
+ | **// | ||
+ | |||
+ | 5 puntos a cada uno cuando estén en '' | ||
+ | |||
+ | **Servidores Web** | ||
+ | |||
+ | 1,2 puntos a cada uno en '' | ||
+ | |||
+ | **Servidores WebLogic** | ||
+ | |||
+ | 2 puntos a cada uno en '' | ||
+ | |||
+ | **Cluster MySQL** | ||
+ | |||
+ | 5 puntos a cada nodo en '' | ||
+ | |||
+ | ^Tipo de elemento | ||
+ | | ::: ^Normal | ||
+ | |Router | ||
+ | |Switch | ||
+ | |Apache server | ||
+ | |WebLogic server | ||
+ | |MySQL server | ||
+ | |||
+ | Al estar en una situación normal la suma de pesos es cero, por ello en este ejemplo se establece que el umbral para estado '' | ||
+ | |||
+ | ^Configuración del servicio | ||
+ | ^Normal | ||
+ | |0 |> | ||
+ | |||
+ | Escenarios de fallos: | ||
+ | |||
+ | * Un servidor Web Apache está fuera de línea (estado '' | ||
+ | |||
+ | * Un servidor WEB y un WebLogic, ambos en estado '' | ||
+ | |||
+ | * Ahora son dos servidores WEB y un WebLogic fuera de línea: 2 x 1,2 + 1 x 2 = 4,4; en este caso sobrepasó el umbral de advertencia por lo que pasa a estado '' | ||
+ | |||
+ | * A la situación anterior agregamos un // | ||
+ | |||
+ | En esta última situación, **Pandora FMS alertará** | ||
+ | |||
+ | <WRAP center round tip 60%> Usted puede obtener información interesante acerca de Monitorización de Servicios en el [[https:// | ||
+ | |||
+ | === Servicios raíz === | ||
+ | |||
+ | <WRAP center round tip 60%> {{: | ||
+ | |||
+ | Un Servicio Raíz es aquel que no forma parte de otro Servicio. Este concepto lógico permite agilizar la monitorización, | ||
+ | |||
+ | Así mismo, y partiendo de esta base, cuando un Servicio definido en un nodo de Pandora FMS aparezca como elemento de un Servicio Raíz en [[: | ||
+ | |||
+ | Esto aporta una lógica distribuida más eficiente y permite aplicar un sistema de [[: | ||
+ | |||
+ | Los Servicios en Metaconsola permiten agregar como elementos de un Servicio tanto otros Servicios, como Módulos y/o Agentes, ya que en versiones previas sólo admitían Servicios de Nodo. | ||
+ | |||
+ | ==== Creación de un nuevo Servicio ==== | ||
+ | |||
+ | === Pandora Server === | ||
+ | |||
+ | <WRAP center round important 60%> El componente **PredictionServer** | ||
+ | |||
+ | Es necesario que el componente [[: | ||
+ | |||
+ | === Introducción === | ||
+ | |||
+ | Los servicios pueden representar: | ||
+ | |||
+ | * Módulos. | ||
+ | * Agentes completos. | ||
+ | * Otros Servicios. | ||
+ | |||
+ | Los valores de un Servicio se calculan por medio del Servidor de Predicción (// | ||
+ | |||
+ | Una vez que tiene todos los dispositivos monitorizados, | ||
+ | |||
+ | Para crear un nuevo Servicio tendremos que ir a **Topology Maps** | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Aparece así una vista de árbol con todos los Servicios. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | === Configuración inicial === | ||
+ | |||
+ | Para crear un nuevo Servicio haga clic en el botón **Create Service** | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | **Name** | ||
+ | |||
+ | Debe ser un nombre único, que permitirá identificar el Servicio. | ||
+ | |||
+ | **Description** | ||
+ | |||
+ | Obligatorio. Dicha descripción, | ||
+ | |||
+ | **Group** | ||
+ | |||
+ | Grupo al que pertenece el servicio, útil en restricciones de [[: | ||
+ | |||
+ | **Agent to store data** | ||
+ | |||
+ | El Servicio guarda los datos en unos Módulos especiales de datos (en concreto los Módulos de predicción). Es necesario introducir un agente para que sea el contenedor de estos módulos, y a la vez también contendrá las alarmas (ver siguientes pasos). | ||
+ | |||
+ | <WRAP center round tip 60%> **Nota**: Tenga en cuenta que el intervalo en el que se realizarán todos los cálculos de los módulos del servicio dependerán del intervalo del agente configurado como contenedor. </ | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | **Mode** | ||
+ | |||
+ | Modo en el que se realizará el cálculo de pesos de los elementos. Puede tener 2 valores: | ||
+ | |||
+ | * **Smart**: Los pesos y elementos que formen parte del Servicio se calcularán de forma automática en base a reglas establecidas. | ||
+ | * **Manual**: Los pesos y los elementos que formen parte del Servicio se indicarán manualmente con valores fijos. | ||
+ | * **Crítico**: | ||
+ | * **Advertencia**: | ||
+ | **Unknown elements as critical** | ||
+ | |||
+ | Permite indicar que los elementos en estado desconocido aporten su peso igual que si fuesen un elemento crítico. <WRAP center round important 60%> El modo // | ||
+ | |||
+ | Los modos // | ||
+ | |||
+ | **Favorite** | ||
+ | |||
+ | Crea un enlace directo en el menú lateral y se podrán filtrar los Servicios en las vistas en base a este criterio. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | **Quiet** | ||
+ | |||
+ | Activa el modo silencio del Servicio, por lo que no generará alertas ni eventos. | ||
+ | |||
+ | **Cascade protection enabled** | ||
+ | |||
+ | Activa la protección en cascada sobre los elementos del Servicio. Estos no generarán alertas ni eventos si pertenecen a un Servicio (o // | ||
+ | |||
+ | **Calculate continuos SLA** | ||
+ | |||
+ | Activa la creación de módulos de SLA y SLA value para el Servicio actual. Se utiliza para casos en los que el número de Servicios necesarios es tan alto que puede afectar al rendimiento. | ||
+ | |||
+ | <WRAP center round important 60%> Si usted desactiva esta última opción, luego de haber creado el Servicio, borrará el histórico de datos de estos Módulos, por lo que perderá información. </ | ||
+ | |||
+ | **SLA interval** | ||
+ | |||
+ | Periodo de tiempo para calcular el SLA efectivo del servicio. | ||
+ | |||
+ | **SLA limit** | ||
+ | |||
+ | Umbral de estado en OK del servicio para que se considere un SLA positivo durante el periodo de tiempo que ha configurado en el campo previo. | ||
+ | |||
+ | **Alerts** | ||
+ | |||
+ | En esta sección debe seleccionar la plantillas que tendrá el Servicio para lanzar la alerta cuando el servicio pase a los estados de advertencia, | ||
+ | |||
+ | === Configuración de elementos === | ||
+ | |||
+ | Una vez rellenado correctamente el formulario se registra un Servicio vacío el cual hay que rellenar con sus elementos. En el formulario de edición del Servicio, seleccione la pestaña ' | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Haga clic en el botón **Add element** | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | **Description** | ||
+ | |||
+ | Texto opcional que se usará para representar el elemento en el mapa de servicio. Si no se indica se usará el nombre del Módulo, Agente o Servicio (según el elemento añadido). | ||
+ | |||
+ | **Type** | ||
+ | |||
+ | Elija un Servicio, Módulo o Agente; si está en modo //Smart//, además aparecerá el tipo **Dynamic** | ||
+ | |||
+ | **Agent** | ||
+ | |||
+ | Buscador de agentes (visible si el elemento a crear o editar es de tipo Agente o Módulo). | ||
+ | |||
+ | **Module** | ||
+ | |||
+ | Lista desplegable con los módulos del Agente elegido previamente en el buscador (solo visible si se edita o se crea un elemento para el Servicio de tipo módulo). | ||
+ | |||
+ | **Servicio** | ||
+ | |||
+ | Lista desplegable de los servicios para crear un elemento (solo visible si el elemento a crear o editar es de tipo servicio). | ||
+ | |||
+ | <WRAP center round tip 60%> Debe tener en siempre cuenta que los servicios que aparecerán en la lista desplegable son los que **no** | ||
+ | |||
+ | == Modo Manual == | ||
+ | |||
+ | Los siguientes campos solo estarán disponibles para los servicios en modo manual: | ||
+ | |||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | Para calcular el estado de un servicio, se sumará el peso de cada uno de sus elementos en base a su estado, y si supera los umbrales establecidos en el servicio para advertencia o para crítico, el estado del servicio pasará a advertencia o crítico según corresponda. | ||
+ | |||
+ | == Modo Smart == | ||
+ | |||
+ | En los servicios en modo inteligente, | ||
+ | |||
+ | * Los elementos críticos contribuyen con la **totalidad** | ||
+ | * Los elementos en advertencia contribuyen con la **mitad** | ||
+ | |||
+ | **Modo Dynamic** | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Los siguientes campos solo estarán disponibles para los elementos de tipo **Dynamic** | ||
+ | |||
+ | **Matching object types** | ||
+ | |||
+ | Lista desplegable para elegir si los elementos para los que se evaluarán las reglas dinámicas, y que formarán parte del servicio, serán Agentes o Módulos. | ||
+ | |||
+ | **Filter by group** | ||
+ | |||
+ | Regla para indicar el grupo al que debe pertenecer el elemento para formar parte del servicio. | ||
+ | |||
+ | **Having agent name** | ||
+ | |||
+ | Regla para indicar el nombre del Agente que debe tener el elemento para formar parte del Servicio. Se indicará un texto que deberá ser parte del nombre del Agente deseado. | ||
+ | |||
+ | **Having module name** | ||
+ | |||
+ | Regla para indicar el nombre del Módulo que debe tener el elemento para formar parte del Servicio. Se indicará un texto que deberá ser parte del nombre del Módulo deseado. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | **Use regular expresions selector** | ||
+ | |||
+ | Si usted activa esta opción, se utilizará el mecanismo de búsqueda mediante [[wpes> | ||
+ | |||
+ | **Having custom field name** | ||
+ | |||
+ | Regla para indicar el // | ||
+ | |||
+ | **Having custom field value** | ||
+ | |||
+ | Regla para indicar el // | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | <WRAP center round tip 60%> Debe colocar texto en ambos campos para que sea considerado el realizar búsqueda en campos personalizados. </ | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | <WRAP center round tip 60%> Desde la versión NG 752 es posible adicionar búsquedas en más campos personalizados, | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | **Ejemplo** | ||
+ | |||
+ | Si se escoge filtrar los Agentes del grupo **Servers** | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | **Ejemplo** | ||
+ | |||
+ | Si la configuración de un elemento dinámico fuese la siguiente. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Se usarían como elementos del servicio todos los módulos que en su nombre incluyan "Host Alive", | ||
+ | |||
+ | <WRAP center round important 60%> Los elementos dinámicos no se ven afectados por la protección en cascada de servicios. </ | ||
+ | |||
+ | |||
+ | === Módulos que se crean al configurar un servicio: === | ||
+ | |||
+ | * **SLA Value Service**: Es el valor porcentual del cumplimiento de SLA ( '' | ||
+ | * **Service_SLA_Service**: | ||
+ | * **Service_Service**: | ||
+ | ==== Visualización de los Servicios ==== | ||
+ | |||
+ | === Lista simple de todos los servicios === | ||
+ | |||
+ | Es la lista de operación que muestra todos los servicios creados y a los cuales el usuario tenga derecho de acceso en la Consola de Pandora FMS. Haga clic en **Operación** | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Cada fila representa un Servicio: | ||
+ | |||
+ | **Group** | ||
+ | |||
+ | El icono del grupo al que pertenece el servicio y que el usuario puede ver. | ||
+ | |||
+ | **Critical** | ||
+ | |||
+ | El valor umbral de las sumas de pesos para marcar el servicio como crítico. | ||
+ | |||
+ | **Warning** | ||
+ | |||
+ | El valor umbral de las sumas de pesos para marcar el servicio como en estado de advertencia. | ||
+ | |||
+ | **Value** | ||
+ | |||
+ | El valor de las sumas de pesos de los elementos que contienen el servicio. | ||
+ | |||
+ | **Status** | ||
+ | |||
+ | Un icono que representa el estado del servicio. Hay los siguientes tres posibles estados representados normalmente con los siguientes colores: | ||
+ | |||
+ | * **Rojo**: El Servicio ha entrado en estado de crítico porque la suma de los pesos de los módulos ha superado o igualado el umbral de crítico. | ||
+ | * **Amarillo**: | ||
+ | * **Verde**: El Servicio se mantiene en estado normal o correcto porque la suma de los pesos de los módulos no ha llegado como mínimo al umbral de advertencia. | ||
+ | * **Gris**: El Servicio se mantiene en estado desconocido, | ||
+ | **SLA** | ||
+ | |||
+ | El valor de SLA con alguno de los siguientes valores posibles: | ||
+ | |||
+ | * **OK**: Se cumple el SLA en el periodo definido para el SLA del servicio. | ||
+ | * **INCORRECTO**: | ||
+ | * **N/A**: El SLA esta en estado desconocido, | ||
+ | == Tabla de todos los servicios == | ||
+ | |||
+ | Tabla de visualización rápida de todos los servicios visibles y su estado actual. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | == Lista simple de un servicio y todos los elementos que contiene == | ||
+ | |||
+ | Esta vista es accesible haciendo clic en el nombre de un servicio en la lista de todos los servicios, o a través de la pestaña con icono de lupa en la cabecera de título del servicio. | ||
+ | |||
+ | Pandora FMS mostrará una página parecida a la mostrada en la siguiente captura de pantalla: | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | La lista de los elementos que componen el Servicio está ubicado en la parte inferior: | ||
+ | |||
+ | **Type** | ||
+ | |||
+ | Icono que representa el tipo de elemento; bloque de construcción para los Módulos, bloques apilados para el Agente o icono de un diagrama de red para los Servicios. | ||
+ | |||
+ | **Name** | ||
+ | |||
+ | Texto que tiene el nombre del agente, o el nombre del agente y el módulo, o el nombre del servicio. Todos ellos contienen un enlace a la vista de operación correspondiente. | ||
+ | |||
+ | **Weight critical** | ||
+ | |||
+ | El valor del peso asociado cuando el elemento está en crítico. Las siguientes tres columnas (**Warning weight**, **Weight Unknown** | ||
+ | |||
+ | **Data** | ||
+ | |||
+ | El valor del elemento que según el tipo puede ser: | ||
+ | |||
+ | * **Módulos**: | ||
+ | * **Agentes**: | ||
+ | * **Servicios**: | ||
+ | **Status** | ||
+ | |||
+ | Icono que representa con uno de los colores codificados el estado del elemento. | ||
+ | |||
+ | <WRAP center round important 60%> Debe tener en cuenta que el cálculo de los servicios lo realiza el PredictionServer, | ||
+ | |||
+ | == Vista de mapa de servicio == | ||
+ | |||
+ | Esta vista despliega el servicio lo que permite un vista rápida para conocer cómo influyen los Módulos, Agentes o subservicios en la monitorización del Servicio. Incluso en los subservicios se puede ver a su vez las influencias a la hora de calcular el estado por la suma de los pesos. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Los posibles nodos que hay son: | ||
+ | |||
+ | **Nodo de Módulo** | ||
+ | |||
+ | Representado con el icono de la gráfica del latido de corazón. Este nodo siempre es un nodo final u nodo hoja del que no cuelgan otros nodos. | ||
+ | |||
+ | **Nodo de Agente** | ||
+ | |||
+ | Representado con el icono de caja de CPU. Este también es un nodo final del cual no colgará ningún otro. | ||
+ | |||
+ | **Nodo de Servicio** | ||
+ | |||
+ | Representado con el icono del martillo y la llave fija cruzados. Como es un Servicio debe contener elementos que se representarán como ramas que cuelgan de él. | ||
+ | |||
+ | El color de los Nodos y flechas conectoras depende del estado del nodo, tal como está codificado: verde OK, rojo crítico, amarillo advertencia o gris en estado desconocido. | ||
+ | |||
+ | Dentro del nodo tendrá: | ||
+ | |||
+ | * **Título**: | ||
+ | * **Lista de valores** | ||
+ | * **Crítico**: | ||
+ | * **Advertencia**: | ||
+ | * **Normal**: El peso que suma cuando está en estado OK o normal que no aparecerá en la lista de valores. | ||
+ | * **Desconocido**: | ||
+ | Además, sobre cada elemento del árbol se puede hacer clic y el destino es la vista de operación de cada uno de ellos. | ||
+ | |||
+ | <WRAP center round tip 60%> Cuando el servicio esté en modo //simple//, aparecerá una exclamación roja al lado de cada elemento crítico. </ | ||
+ | |||
+ | == Servicios en la Consola visual == | ||
+ | |||
+ | En la consola visual puede añadir Servicios como otro ítem más a mostrar dentro del mapa. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Para crear un ítem de Servicio en un mapa, el proceso es igual que para el resto de items de los Visual Map pero la paleta de opciones será: | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Controles: | ||
+ | |||
+ | * **Label**: Título que recibirá el Servicio en el mapa visual. | ||
+ | * **Service**: | ||
+ | Hay que tener en cuenta, que un ítem del servicio, al contrario que otros items del mapa visual, no se puede enlazar con otros mapas visuales, y siempre el enlace de la Consola Visual que permita hacer clic, tiene como destino la vista de mapa de Servicio en modo arborescente anteriormente descrito. | ||
+ | |||
+ | === Vista de árbol de los servicios === | ||
+ | |||
+ | Esta vista permite la visualización de los servicios en forma de árbol. | ||
+ | |||
+ | En cada nivel se muestra un recuento del número de elementos que engloba cada servicio o agente. | ||
+ | |||
+ | * Servicios: Informa del número total de Servicios, Agentes y Módulos que pertenecen a dicho servicio. | ||
+ | * Agentes: Informa del número de Módulos en estado critical (color rojo), warning (color amarillo), unknown (color gris), no iniciados (color azul) y estado normal (color verde). | ||
+ | |||
+ | Siempre se mostrarán en el primer nivel aquellos Servicios que no pertenecen a otro. Para el caso de un Servicio hijo, esté se mostrará anidado dentro de su padre. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | <WRAP center round important 60%> La restricción de permisos ACLs sólo se aplica al primer nivel </ | ||
+ | |||
+ | ==== Cómo interpretar los datos de un servicio ==== | ||
+ | |||
+ | Las paradas planificadas recalculan el valor de los informes de SLA teniendo en cuenta que se permita el recálculo “atrás en el tiempo” con paradas planificadas añadidas a posteriori (eso es una opción que se debe activar a nivel global en el setup general). Cuando se trata de un informe de SLA de servicio, si existe una parada planificada que afecta a uno o más elementos del servicio, se considera que la parada planificada afecta a todo el servicio, al no poder definir el impacto que tiene la parada en el global del servicio. | ||
+ | |||
+ | Es importante destacar que esto es a nivel de informe, los árboles de servicio, y la información que presentan en la consola visual no se alteran respecto a paradas planificadas creadas después de su supuesta ejecución. Estos valores de cumplimiento % de servicio se calculan en tiempo real sobre datos del histórico del mismo servicio, no tiene que ver con un informe que se puede “cocinar”. | ||
+ | |||
+ | Por otro lado, es importante conocer cómo se calcula el % de cumplimiento de un servicio: | ||
+ | |||
+ | **Cálculo de pesos en el modo simple ** | ||
+ | |||
+ | Los pesos se tratan de forma algo diferente en el modo simple al solo existir el peso crítico y tener la posibilidad de caer en dos estados a parte del normal. A cada elemento se le da peso 1 en critical y 0 en el resto, y cada vez que se hace un cambio en los elementos del servicio, se recalculan los pesos del servicio. El peso warning del servicio es despreciable, | ||
+ | |||
+ | **Cálculo de pesos según su importancia** | ||
+ | |||
+ | Supongamos que tenemos un servicio, definido por un 95% de cumplimiento en un intervalo de 1 hora. Supongamos esta tabla de valores, donde t es el tiempo, x es el % de cumplimiento del servicio (SLA), y s es si el servicio cumple o no (1 cumple, 0 no cumple). En 1 hora tendríamos exactamente 12 muestras (suponiendo un intervalo de 5 minutos). | ||
+ | |||
+ | Supongamos el caso donde el servicio se cumple bien durante las primeras 11 muestras (primeros 55 minutos) y en el minuto 60 falla, tendríamos estos valores: | ||
+ | < | ||
+ | |||
+ | | ||
+ | --------+-------+-------- | ||
+ | 1 1 100 | ||
+ | 2 1 100 | ||
+ | 3 1 100 | ||
+ | 4 1 100 | ||
+ | 5 1 100 | ||
+ | 6 1 100 | ||
+ | 7 1 100 | ||
+ | 8 1 100 | ||
+ | 9 1 100 | ||
+ | 10 | ||
+ | 11 | ||
+ | 12 | ||
+ | |||
+ | </ | ||
+ | |||
+ | Este caso es fácil de calcular, el % se calcula en función del número de muestras, en t3 por ejemplo son 3 muestras totales, con tres muestras que cumplen servicio, 100%, mientras que en t12, tenemos 12 muestras y 11 válidas: 11/12. | ||
+ | |||
+ | Supongamos que es en medio de la muestra y que se va recuperando poco a poco | ||
+ | < | ||
+ | |||
+ | | ||
+ | --------+-------+-------- | ||
+ | 1 1 100 | ||
+ | 2 1 100 | ||
+ | 3 1 100 | ||
+ | 4 1 100 | ||
+ | 5 1 100 | ||
+ | 6 0 83,3 | ||
+ | 7 1 85,7 | ||
+ | 8 1 87,5 | ||
+ | 9 1 88,8 | ||
+ | 10 | ||
+ | 11 | ||
+ | 12 | ||
+ | |||
+ | </ | ||
+ | |||
+ | Hasta aquí todo parece similar al punto anterior, pero veamos que pasa si continuamos en el tiempo: | ||
+ | < | ||
+ | |||
+ | | ||
+ | --------+-------+-------- | ||
+ | 13 1 91,6 | ||
+ | 14 1 91,6 | ||
+ | 15 1 91,6 | ||
+ | 16 1 91,6 | ||
+ | 17 1 91,6 | ||
+ | 18 1 100 | ||
+ | 19 1 100 | ||
+ | .... | ||
+ | |||
+ | </ | ||
+ | |||
+ | Aquí, vemos un comportamiento poco intuitivo, ya que el volumen de muestras válidas continua siendo 11 para una ventana de tiempo hasta llegar a t18, donde se queda fuera el único valor inválido, de forma que en t18 el cumplimiento pasa a ser del 100%. Este escalón entre 91,6 y 100 se explica por el tamaño de la ventana. Cuando mayor sea la ventana (generalmente en cálculo de SLA es diaria, semanal o mensual) menos abrupto será el escalón. | ||
+ | |||
+ | ==== Protección en cascada de servicios ==== | ||
+ | |||
+ | <WRAP center round tip 60%> {{: | ||
+ | |||
+ | Es posible silenciar aquellos elementos de un Servicio de manera dinámica. Esto permite evitar una avalancha de alertas por cada elemento que pertenezca al Servicio o subservicios. | ||
+ | |||
+ | Al activar la característica ' | ||
+ | |||
+ | Es importante tener en cuenta que este sistema permite que se utilicen las alertas de los elementos que vayan a crítico dentro del Servicio, aunque el estado general del mismo sea correcto. | ||
+ | |||
+ | La protección en cascada de servicios avisará con exactitud de los elementos raíz que hayan fallado sin importar la profundidad del Servicio definido. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | En el ejemplo mostrado, vemos que disponemos de uno de los elementos del servicio en estado crítico. Aunque el servicio principal se mantenga en estado correcto, nos avisará del estado de los elementos incorrectos disparando la alerta relacionada con el elemento en crítico. | ||
+ | |||
+ | ==== Análisis de causa raíz ==== | ||
+ | |||
+ | Dentro de un servicio podemos tener un número ilimitado de sub-servicios (caminos). En versiones anteriores a OUM725, Pandora FMS alertaba indicando el estado del servicio (normal, crítico, advertencia, | ||
+ | |||
+ | Para usarla, agregaremos el siguiente texto a la plantilla que hayamos asociado al servicio: | ||
+ | < | ||
+ | |||
+ | | ||
+ | La cadena de acontecimientos que han provocado el estado del servicio es la siguiente: | ||
+ | _rca_ | ||
+ | |||
+ | </ | ||
+ | |||
+ | Esto nos devolverá una salida similar a la que sigue: | ||
+ | |||
+ | < | ||
+ | Cuerpo de una alerta: Mensaje de ejemplo | ||
+ | La cadena de acontecimientos que han provocado el estado del servicio es la siguiente: | ||
+ | [Aplicación Web -> HW -> Apache server 3] | ||
+ | [Aplicación Web -> HW -> Apache server 4] | ||
+ | [Aplicación Web -> HW -> Apache server 10] | ||
+ | [Aplicación Web -> DB Instances -> MySQL_base_1] | ||
+ | [Aplicación Web -> DB Instances -> MySQL_base_5] | ||
+ | [Aplicación Web -> Balanceadores -> 192.168.10.139] | ||
+ | |||
+ | </ | ||
+ | |||
+ | Viendo esta salida, podemos interpretar, | ||
+ | |||
+ | * Los servidores Apache 3,4 y 10 están en estado crítico | ||
+ | * Las bases de datos MySQL_base 1 y 5 están caídas | ||
+ | * El balanceador 192.168.10.139 no responde | ||
+ | |||
+ | Esta información añadida, nos permite depurar el porqué del estado del servicio, reduciendo las tareas de investigación de causas de una caída. | ||
+ | |||
+ | ==== Agrupaciones de servicios ==== | ||
+ | |||
+ | Los servicios son agrupaciones lógicas que conforman parte de la estructura de negocio de una organización. Por ello puede tener cierto sentido la agrupación de servicios, ya que en muchos casos puede haber dependencias entre unos y otros, conformando por ejemplo un servicio general (la compañía) varios servicios más particulares (web corporativa, | ||
+ | |||
+ | Estas agrupaciones nos ayudarán a por ejemplo: crear mapas visuales, configurar alertas, aplicar políticas de monitorización, | ||
+ | |||
+ | Para entender de forma más clara lo que son las agrupaciones de servicios, a continuación se muestran dos ejemplos. | ||
+ | |||
+ | ==== Ejemplos de monitorización de servicios ==== | ||
+ | |||
+ | === Servicio de Pandora FMS === | ||
+ | |||
+ | Caso de uso en el que se monitoriza el estado del Servicio de monitorización de Pandora FMS, compuesto por el servicio Apache, el servicio MySQL, Pandora server y Tentacle, con sus respectivos pesos de importancia. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Cada uno de estos elementos constituye a su vez un Servicio con distintos componentes, | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | En este caso, el Servicio general de Pandora FMS alcanzará el estado '' | ||
+ | |||
+ | * **MySQL: | ||
+ | * **Pandora Server: | ||
+ | * **Apache: | ||
+ | * **Tentacle: | ||
+ | === Servicio de almacenamiento en cluster, agrupación de servicios === | ||
+ | |||
+ | Los Servicios son agrupaciones lógicas que conforman parte de la estructura de negocio de una organización. Por ello, puede tener sentido -y utilidad- la agrupación de servicios ya que a veces los Servicios por sí solos no tienen un significado completo. Para agrupar servicios simplemente se añaden como elemento a un Servicio superior, creando así una nueva agrupación lógica. | ||
+ | |||
+ | En el siguiente ejemplo tenemos un // | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Según esta estructura, el umbral de criticidad del servicio de almacenamiento de la compañía se alcanzará únicamente si los dos servidores de archivos fallan, ya que esto denegaría totalmente el servicio, mientras que la caída de uno de ellos tan sólo supondría un servicio degradado. | ||
+ | |||
+ | En la siguiente imagen puede observarse la configuración de pesos otorgada a los dos elementos principales del servicio de almacenamiento: | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | En la siguiente imagen podemos ver el contenido y configuración de pesos del servicio agrupado FS01. Aquí los elementos tendrán un peso específico en función de su criticidad, siendo: | ||
+ | |||
+ | * **FS01 ALIVE: | ||
+ | * **DHCPserver ping: | ||
+ | * **Discos**: Se les otorga un peso individual de 1 en caso de que alcancen su umbral crítico, y 0,5 para su umbral '' | ||
+ | {{ : | ||
+ | |||
+ | [[: | ||
+ | |||