Мониторинг виртуальных сред
Мониторинг виртуальных сред
Виртуальные среды занимают важное место в ИТ-архитектурах всех компаний, поэтому их мониторинг крайне важен. С помощью Pandora FMS Enterprise вы сможете получить доступ к Amazon EC2, VMware, RHEV, Nutanix, XenServer, OpenNebula, IBM HMC, HPVM.
Amazon EC2
Для мониторинга EC2 в корпоративных средах, пожалуйста, перейдите на Discovery
Это руководство соответствует компоненту OpenSource для мониторинга EC2.
Этот специфический мониторинг использует CloudWatch API для мониторинга ваших экземпляров на службе Amazon EC2. На вашем экземпляре должна быть включена функция Cloudwatch. Вы можете получить бесплатный плагин в разделе библиотека модулей.
Основная цель этого удаленного плагина сервера заключается в получении информации от ваших экземпляров с помощью плагина сервера Pandora FMS. Это означает, что вам нужно будет зарегистрировать плагин на сервере и настроить различные модули для получения информации с ваших серверов EC2.
Пример выполнения с использованием коннектора \
>
/home/slerena/ec2_plugin.sh \ -A AKIAILTVCAS26GTKLD4A \ -S CgmQ6DxUWES05txju alJLoM57acDudHogkLotWk \ -i i_9d0b4af1 \ -n AWS/EC2 \ -m CPUUtilization
Возвращает числовое значение (процент) метрики CPUUtilization
в экземпляре i_9d0b4af1
.
Для установки вам понадобятся:
1. На вашем сервере Pandora FMS должна быть доступна JAVA с соответствующим каталогом JAVAHOME
.
2. Скопировать этот плагин на путь и установить разрешения в 755, настроить базовый путь в переменной AWS_CLOUDWATCH_HOME
, которая присутствует в первых строках плагина. Вы должны отредактировать первые несколько строк плагина .
Plugin состоит из нескольких файлов:
/ec2_plugin.sh
- Это сам плагин. /bin/*
- Компоненты Amazon CloudWatch (Monitoring) Command Line Tools, включенные в этот пакет. Эти скрипты распространяются по лицензии Apache.
Поместите весь пакет в каталог, доступный серверу, например:
/usr/share/pandora_server/plugin/ec2
И установите AWS_CLOUDWATCH_HOME
в /usr/share/pandora_server/plugin/ec2
.
Чтобы подтвердить установку, выполните:
/usr/share/pandora_server/plugin/ec2/mon-cmd --version
В результате должно вернуться что-то похожее на:
Amazon CloudWatch CLI version 1.0.9.5 (API 2010-08-01)
Если вы получите ту же строку, значит, все готово к использованию плагина.
Если нет, вам, вероятно, потребуется установить и правильно настроить инструменты командной строки Amazon CloudWatch (мониторинг).
Установка
Требования:
- Убедитесь, что в вашей системе установлена Java версии 1.5 или выше, для этого выполните:
java -version
- Распакуйте файл
.zip
развертывания . - Установите следующие переменные среды:
AWS_CLOUDWATCH_HOME
- Каталог, в который были скопированы файлы развертывания для их проверки с помощью:
Unix: ls ${AWS_CLOUDWATCH_HOME}/bin (should list mon-list-metrics ...) Windows: dir %AWS_CLOUDWATCH_HOME%\bin (should list mon-list-metrics ...)
JAVA_HOME
- Каталог Home установки Java.- Добавьте к пути по умолчанию (path) следующее:
${AWS_CLOUDWATCH_HOME}/bin
- В Windows:
%AWS_CLOUDWATCH_HOME%\bin
Конфигурация
Установите учетные данные пользователя AWS в инструменте командной строки. Существует два способа предоставления учетных данных:
- Пароли AWS.
- Использование сертификатов X.509.
Использование паролей AWS
Вы можете явно указать учетные данные в командной строке:
- -I ACCESS_KEY –S SECRET_KEY
Вы также можете создать файл учетных данных. Развертывание включает файл шаблона:
${AWS_CLOUDWATCH_HOME}/credential-file-path.template.
Вы должны отредактировать копию этого файла, чтобы добавить свою информацию. В UNIX это также происходит путем ограничения разрешений для владельца файла учетных данных ( credential-file
):
$ chmod 600 <credential-file>.
Когда файл будет создан, обратитесь к нему следующим образом:
- Установите следующую переменную среды:
export AWS_CREDENTIAL_FILE=<credential-file>
- Вы также можете указать следующую опцию для каждой команды:
- -aws-credential-file <credential-file>
Использование сертификатов X.509
Сохраните личный сертификат и пароль в файлах: my_cert.pem
и my-pk.pem
.
Существует два способа предоставления сертифицированной информации в командную строку:
- Установите следующие переменные среды:
EC2_CERT=/path/to/cert/file EC2_PRIVATE_KEY=/path/to/key/file
- Укажите файлы непосредственно в командной строке для всех команд:
<command> \ --ec2-cert-file-path=/path/to/cert/file \ --ec2-private-key-file-path=/path/to/key/file
Установка свойств JVM
Установив переменную среды SERVICE_JVM_ARGS
, вы можете произвольно передавать свойства JVM в командную строку.
Например, следующая строка устанавливает свойства в Linux/UNIX
export SERVICE_JVM_ARGS="-Dhttp.proxyHost=http://my.proxy.com -Dhttp.proxyPort=8080"
Ввод в эксплуатацию
Убедитесь, что ваша установка работает правильно, выполнив следующую команду:
$ mon-cmd --help
Вы должны увидеть страницу использования для всех команд мониторинга.
$ mon-list-metrics --headers
Вы также должны увидеть строку заголовка. Если у вас есть еще какие-либо определенные метрики, они также должны появиться.
VMware
С Pandora FMS Enterprise вы можете получить доступ к VMware Monitoring Plugin, плагину, который позволяет вам контролировать виртуальную архитектуру VMware простым способом.
Архитектура VMware для мониторинга
С помощью этой системы можно контролировать архитектуры, подобные той, что показана на следующей схеме:
Pandora FMS может контролировать VCenter, серверы ESXi и компоненты виртуализации: Datastores и виртуальных машин. Pandora FMS полагается на API, который предоставляет SDK от VMware® для Perl для сбора данных.
Мониторинг с Discovery Application VMware
Выполните действия, описанные в разделе Discovery для мониторинга инфраструктуры VMware®.
Требования для плагина VMware
Требования для осуществления задачи мониторинга VMware® следующие:
- Pandora FMS v7.0NG.732 или выше.
- VMware vSphere® SDK для языка Perl.
Конфигурация vCenter для мониторинга
Discovery Applications VMware использует метрики, предоставляемые API vCenter® и ESXi VMware®. Доступность этих метрик зависит от уровней, настроенных для сбора статистики.
Эти уровни можно изменить в меню vCenter Server Settings и в опции Statistics. Для каждого варианта времени и каждого уровня вы получите описание счетчиков, которые собирает vCenter. Минимальный уровень для мониторинга с помощью плагина Pandora FMS - Уровень 2.
В зависимости от конфигурации vCenter, возможно, что некоторые модули не будут сообщать данные в Pandora FMS.. Это может быть связано с тем, что:
- Отсутствует установка какого-нибудь плагина в vCenter.
- Необходимо установить Агент VMware® (vmware-tools) в структуру.
- Просто потому, что структура выключена (виртуальная машина или ESXi).
Для устранения этих проблем следует обратиться к документации VMware..
Некоторые решения, такие как мониторинг состояния оборудования (Hardware Status), могут потребовать расширенной настройки как vCenter, так и хостов, поддерживающих ESX.
Развертывание системы мониторинга VMware
Начиная с версии 732 Pandora FMS, мониторинг VMware осуществляется с помощью системы Discovery Applications (дополнительная информация в разделе Discovery VMware).
Если по какой-то причине вы хотите вручную настроить плагин вне этой функции, вы можете использовать классический режим, описанный ниже.
Если вам необходимо развернуть или обновить вашу версию плагина VMware до более новой, выполните действия, описанные в следующих пунктах:
Ручное развертывание плагинов
1.- Перейдите в каталог, в который были извлечены файлы плагина VMWare®.
2.- Скопируйте vmware-plugin.{pl,conf}
в соответствующий каталог.
sudo cp vmware-plugin.pl vmware-plugin.conf /usr/share/pandora_server/util/plugin/ sudo chown pandora:apache /usr/share/pandora_server/util/plugin/vmware-plugin.{pl,conf} sudo chmod g w /usr/share/pandora_server/util/plugin/vmware-plugin.conf
3.- Проверьте данные, необходимые для настройки плагина.
В меню "Конфигурация" консоли Pandora FMS назначьте пароль для API, а также разрешенные источники.
4.- Отредактируйте файл конфигурации vmware-plugin.conf
.
5.- Проверьте доступность VMware® SDK для Perl.
Для проверки установки VMware® SDK Perl можно запустить скрипт со следующим содержанием:
#!/usr/bin/perl use strict; use warnings; use VMware::VIRuntime; print "VMware SDK Version: " . $VMware::VIRuntime::VERSION . "\n";
Выполните скрипт:
perl check_vmware.pl
Вывод должен быть похож на следующий:
VMware SDK Version: 6.5.0
Убедитесь, что версия SDK выше или равна версии ваших продуктов VMware®.
Начиная с версии 717 плагина для VMware® вам также необходимо установить библиотеку Perl PluginTools.pm, (доступна вместе с сервером в /usr/lib/perl5/PandoraFMS
) на устройстве, где вы хотите его развернуть (скопируйте в /usr/lib/perl5/PandoraFMS
на устройстве, на котором будет запущен плагин).
Установка VMware vSphere SDK для Perl
URL-адрес центра загрузки необходимого программного обеспечения VMware®:
https://my.vmware.com/web/vmware/details?downloadGroup=VS-PERL-SDK65&productId=614
Установка SDK для Linux
Версии SDK, протестированные с помощью этого процесса установки, были 4.1, 5.1, 6.0 и 6.5
Всегда рекомендуется использовать версию SDK с соответствующей ей версией программного обеспечения. VMware®. Например, рекомендуется использовать программное обеспечение 4.1 VMware® с версией SDK 4.1.
Сначала распакуйте SDK с помощью следующей команды:
# tar -xzvf VMware-vSphere-Perl-SDK-x.x.x-xxxxxx.i386.tar.gz
Теперь скомпилируйте и установите SDK с помощью следующих команд:
# perl Makefile.PL # make # make install
Если установка прошла успешно и ошибок не возникло, вы можете подключиться к vCenter® с помощью следующей команды, используя такой коннектор строк :
# /usr/lib/vmware-viperl/apps/general/connect.pl \ --server <vcenter_ip> \ --username <vcenter_user> \ --password <vcenter_pass>
Ответ должен быть похож на приведенный ниже:
Connection Successful Server Time : 2013-02-21T16:24:05.213672Z
Обновление SDK до версии 6.5 с других версий
Если вы выполняете обновление VMware SDK, выполните следующие действия:
- Установите инструменты для разработчиков:
yum groupinstall "Developer Tools"
- Установите CPAN:
yum install perl-CPAN
- Установите некоторые зависимости:
yum install openssl-devel perl-Class-MethodMaker yum install epel-release
- Распакуйте установочные файлы VMware® SDK Perl:
tar xvzf VMware-vSphere-Perl-SDK-6.5.0-4566394.x86_64.tar.gz
- Получите доступ к каталогу:
cd vmware-vsphere-cli-distrib
- Запустите программу установки:
./vmware-install.pl
Для CentOS 8 вам также следует выполнить следующие шаги:
# Enable epel repo: yum install epel-release # Enable powertools: yum install dnf-utils yum config-manager --set-enabled PowerTools # Note: For centos 8 install custom made RPMs from Artica repo: `yum install http://firefly.artica.es/centos8/perl-Crypt-SSLeay-0.73_07-1.gf.el8.x86_64.rpm` before install SDK # Install the vmware SDK -- Custom RPM 6.5: `yum install http://firefly.artica.es/centos8/VMware-vSphere-Perl-SDK-6.5.0-4566394.x86_64.rpm`
Во время установки:
- Согласитесь с условиями лицензии.
- Укажите не использовать предварительно созданные модули для VMware® SDK.
- Согласитесь с автоматической установкой модулей через автоматизированную систему CPAN.
- Убедитесь, что все требования были установлены правильно.
- Укажите каталог, в котором нужно будет установить модули VMware® SDK Perl
Nota: Иногда пакет Perl UUID может выдавать ошибки при установке на CentOS 7. Выполните следующие действия, чтобы добавить компонент:
- Установите необходимые зависимости для UUID-0.03:
yum install libuuid-devel perl-JSON-PP
- Загрузите пакет с кодом:
wget https://cpan.metacpan.org/authors/id/C/CF/CFABER/UUID-0.03.tar.gz
- Распакуйте файл и откройте каталог:
tar xvzf UUID-0.03.tar.gz cd UUID-0.03
- Сгенерируйте файлы, необходимые для компиляции модуля Perl:
perl Makefile.PL
- Скомпилируйте модуль Perl:
make
- Вы должны получить ответ, аналогичный следующему:
Manifying blib/man3/UUID.3pm
- Установите новый скомпилированный модуль:
make install
После установки ожидающих модулей снова запустите процесс установки VMware® SDK Perl:
./vmware-install.pl
Примечание: деинсталлятор VMware® не полностью удаляет предыдущие библиотеки модулей VMware.
Убедитесь, что библиотеки установлены правильно в /usr/lib/vmware-vcli/VMware/share/
прежде чем продолжить
Вы должны выполнить следующие действия вручную:
- Очистить старые библиотеки.
rm -rf /usr/share/perl5/vendor_perl/VMware rm -rf /usr/share/perl5/VMware
- Добавить новые библиотеки VMware®
cp -R /usr/lib/vmware-vcli/VMware/share/VMware /usr/share/perl5/vendor_perl/
После этого можно запустить скрипт со следующим содержанием для проверки установки VMware® SDK Perl.
#!/usr/bin/perl use strict; use warnings; use VMware::VIRuntime; print "VMware SDK Version: " . $VMware::VIRuntime::VERSION . "\n";
Выполните этот script:
perl check_vmware.pl
Вывод должен быть следующим:
VMware SDK Version: 6.5.0
Если выход отличается, проверьте, правильно ли вы выполнили все шаги, или обратитесь в службу поддержки по адресу https://support.pandorafms.com/integria/
Зависимости SDK для CentOS 7 и CentOS 8 следующие:
gdbm-devel glibc-devel glibc-headers kernel-headers libdb-devel libuuid-devel make openssl perl-Business-ISBN perl-Business-ISBN-Data perl-Class-Inspector perl-Class-MethodMaker perl-Convert-BinHex perl-Crypt-SSLeay perl-Digest perl-Digest-MD5 perl-Email-Date-Format perl-Encode-Locale perl-ExtUtils-Install perl-ExtUtils-MakeMaker perl-ExtUtils-Manifest perl-ExtUtils-ParseXS perl-File-Listing perl-HTML-Parser perl-HTML-Tagset perl-HTTP-Cookies perl-HTTP-Daemon perl-HTTP-Date perl-HTTP-Message perl-HTTP-Negotiate perl-IO-HTML perl-IO-SessionData perl-IO-Socket-IP perl-IO-Socket-SSL perl-JSON-PP perl-LWP-MediaTypes perl-LWP-Protocol-https perl-MIME-Lite perl-MIME-Types perl-MIME-tools perl-MailTools perl-Mozilla-CA perl-Net-HTTP perl-Net-LibIDN perl-Net-SMTP-SSL perl-Net-SSLeay perl-SOAP-Lite perl-Test-Harness perl-TimeDate perl-URI perl-WWW-RobotRules perl-XML-LibXML perl-XML-NamespaceSupport perl-XML-Parser perl-XML-SAX perl-XML-SAX-Base perl-devel perl-libwww-perl pyparsing systemtap-sdt-devel glibc glibc-common libblkid libmount libsmartcols libuuid util-linux
Для CentOS 8 установите RPMs perl-Crypt-SSLeay из репозитория Artica:
yum install `http://firefly.artica.es/centos8/perl-Crypt-SSLeay-0.73_07-1.gf.el8.x86_64.rpm`
Вы можете установить дополнительные зависимости плагина с помощью следующей команды:
`yum install perl-Archive-Zip perl-JSON`
Вы можете установить зависимости шифрования пароля с помощью следующей команды:
`yum install openssl-devel perl-Crypt-CBC perl-Digest-SHA`
Вы можете загрузить пользовательские RMP perl-Crypt-OpenSSL-AES из репозитория Artica:
- Для CentOS 7.
`yum install https://sourceforge.net/projects/pandora/files/Tools and dependencies (All versions)/RPM CentOS, RHEL/perl-Crypt-OpenSSL-AES-0.02-1.el7.x86_64.rpm`
- Для CentOS 8.
`yum install https://sourceforge.net/projects/pandora/files/Tools and dependencies (All versions)/RPM CentOS, RHEL/perl-Crypt-OpenSSL-AES-0.02-1.el8.x86_64.rpm`
Установка SDK на Windows
Версия PERL, распространяемая вместе с vSphere® SDK, не работает с библиотеками VMware® для PERL. Чтобы решить эту проблему, выполните следующие действия:
- Установите VMware vSphere® SDK.
- Установите Strawberry PERL версии 5.12 из http://strawberryperl.com/releases.html.
- Скопируйте каталог:
%ProgramFiles%\VMware\VMware vSphere CLI\Perl\lib\VMware
a
C:\strawberry\perl\lib
- Удалите VMware vSphere® SDK.
Конфигурация плагина VMware
Вы можете настроить VMware плагин вручную или с помощью расширения консоли, доступного вместе с загружаемыми файлами плагина VMware®.
Настройка плагина вручную
Для управления несколькими конфигурациями плагина de VMware® рекомендуется использовать расширение, доступное в консоли Pandora FMS.
Вы можете вручную отредактировать файл конфигурации; помните, что строки, начинающиеся с #
, будут интерпретироваться как комментарии.
Конфигурационный файл плагина мониторинга среды VMware содержит следующие общие элементы:
server
FQDN или IP сервера VMware® для мониторинга.
user
Пользователь с правами в vCenter®.
pass
Пароль пользователя.
datacenter
Имя центра данных (по умолчанию: ha-datacenter
).
temporal
Временный рабочий каталог, по умолчанию: /tmp
logfile
Файл журнала, по умолчанию /tmp/vmware_plugin.log
entities_list
Файл объектов для мониторинга, по умолчанию /tmp/vmware_entitites_list.txt
transfer_mode
Режим передачи XML в Pandora, по умолчанию локальный.
tentacle_ip
Адрес сервера Pandora FMS, по умолчанию 127.0.0.1
tentacle_port
Порт для связи с Tentacle, по умолчанию 41121
.
tentacle_opts
Дополнительные опции для удаленного Tentacle
local_folder
При локальной передаче папка назначения для XML-файлов отчета /var/spool/pandora/data_in
pandora_url
Веб-адрес консоли Pandora FMS, по умолчанию http://127.0.0.1/pandora_console
.
api_pass
Пароль API консоли Pandora FMS.
api_user
Пользователь с доступом к API Pandora FMS.
api_user_pass
Пароль пользователя с доступом к API.
retry_send
Повторить( 1
) или нет ( 0
) отправку XML в случае ошибки (аналогичный buffer_xml).
event_mode
Восстановить информацию ( 1
) событий VMware или нет ( 0
).
event_pointer_file
Вспомогательный индексный файл для событий VMware, по умолчанию /tmp/vmware_events_pointer.txt
Virtual network monitoring
Включить мониторинг виртуальных коммутаторов.
Encrypt passwords
Используйте зашифрованные пароли в файле конфигурации.
verbosity
Уровень отладки (рекомендуется 1
).
threads
Максимальное количество используемых потоков (рекомендуется 4
).
interval
Интервал в секундах генерируемых агентов и модулей (настраивается в зависимости от частоты выполнения плагина).
Recon Interval
Интервал в секундах, после которого временный файл кэша объектов автоматически удаляется для повторного сканирования инфраструктуры VMware®.
group
Серверы Целевая группа агентов, создаваемых плагином..
virtual_network_monitoring
Включает ( 1
) или выключает ( 0
) мониторинг виртуальных коммутаторов (стандарт).
use_ds_alias_as_name
Включает ( 1
) или выключает ( 0
) использование алиас в качестве имени Агента в агентах хранения данных.
Сервер, центр данных, пользователь, пароль и интервал можно настроить через консоль Pandora.
Если вы используете Pandora FMS 5.0 или более позднюю версию и хотите использовать расширения плагина или применить мониторинг событий, вам необходимо правильно настроить Pandora FMS API. Для этого вы должны добавить пароль API и предоставить доступ к соответствующим адресам в списке доступа API. Эти поля определены в общей конфигурации Консоли Pandora FMS.
Пользователь, которого вы используете вместе с паролем API, должен иметь права на чтение и запись для записи событий. Также не забудьте включить агентов Datacenter в план мониторинга, поскольку события для консоли происходят от этих агентов.
Раздел «Reject» плагина мониторинга среды VMware® содержит следующий параметр:
- all_ipaddresses
Если эта инструкция присутствует, IP-адрес в XML не будет обновляться. Эта инструкция действительна и для заданий.
Настройка мониторинга VMware
Выполните действия, описанные в VMware Discovery для настройки мониторинга инфраструктуры VMware с помощью Discovery.
Выполнение плагина VMware
Для проверки работы вашей конфигурации вы можете выполнить:
perl \ /usr/share/pandora_server/util/plugin/vmware-plugin.pl \ /usr/share/pandora_server/util/plugin/vmware-plugin.conf
Примечание:
- Для VMware SDK 6.5.0, если во время выполнения плагина вы получили следующий вывод:
Server version unavailable at 'https://your_vmwre_fqdn:443/sdk/vimService.wsdl' at /usr/local/lib64/perl5/VMware/VICommon.pm line 734.
Рекомендуемое решение - настроить версии библиотек Perl LWP:
cpan install GAAS/libwww-perl-5.837.tar.gz
Настоятельно рекомендуется использовать Discovery Applications VMware для мониторинга вашей инфраструктуры.
Планирование выполнения из Агента Pandora FMS
Для использования Агента Pandora FMS необходимо скопировать vmware-plugin.{pl,conf}
в место, доступное для Агента Pandora FMS:
sudo cp \ /usr/share/pandora_server/util/plugin/vmware-plugin.{pl,conf} \ /etc/pandora/plugins/
Чтобы создать файл конфигурации
vmware-plugin-events.conf
скопируйте vmware-plugin.conf
и измените вручную event_mode
a 1.
Теперь вы должны добавить новый модуль типа plugin в конфигурационный файл агента следующей строкой:
module_plugin perl \ /etc/pandora/plugins/vmware-plugin.pl \ /etc/pandora/plugins/vmware-plugin.conf
Если вы также хотите сделать копию событий, вы должны создать другой Модуль плагин с другим конфигурационным файлом, который позволит копировать события. Синтаксис выглядит следующим образом:
module_plugin perl \ /etc/pandora/plugins/vmware-plugin.pl \ /etc/pandora/plugins/vmware-plugin-events.conf
В системах Windows® необходимо указать используемый интерпретатор:
module_plugin perl "%ProgramFiles%\pandora_agent\util\vmware-plugin.pl" "%ProgramFiles%\pandora_agent\util\vmware-plugin.conf"
В следующих разделах подробно описаны параметры конфигурационного файла плагина.
Запуск плагина VMware может занять много времени из-за большого количества зарегистрированных объектов.
Мы рекомендуем проводить мониторинг через Discovery, чтобы DiscoveryServer сам позаботился об этих задачах.
Если вы решите проводить мониторинг другим способом, может потребоваться распределить нагрузку между несколькими программными агентами Pandora FMS или выбрать другой режим программирования. Всю информацию об этом можно найти в следующих разделах
Планирование выполнения из cron системы
Вы можете запланировать выполнение плагина из самого cron системы. Помните, что интервальное значение созданных элементов ( interval
в конфигурации) и периодичность выполнения должны быть согласованы:
# Input to add to crontab, set a range of 600 to use this setting/10 * * * * root perl /usr/share/pandora_server/util/plugin/vmware-plugin.pl /usr/share/pandora_server/util/plugin/vmware-plugin.conf
В приведенном выше примере показана строка, которую нужно добавить в crontab. Установите интервал 600 для использования этой конфигурации
Мониторинг виртуальной архитектуры VMware
Чтобы увидеть результат выполнения плагина, откройте подменю Agent Detail в меню Views.
В этом виде появятся Агенты, созданные плагином, вместе с другими Агентами Pandora FMS.
Если вы щелкните на имени агента, вы откроете просмотр агента Pandora FMS, где будут отображаться модули, контролируемые плагином VMware.
По умолчанию плагин развертывает базовый мониторинг для каждого из элементов VMware®.
Мониторинг центра данных по умолчанию
- Ping
- Check 443 port
Мониторинг центра данных по умолчанию
- Capacity
- Free Space
- Disk Overallocation
- Free Space Bytes
Мониторинг ESXi по умолчанию
- CPU Usage
- Memory Usage
- Data received
- Data transmitted
- Disk Read Latency
- Disk Write Latency
- Host Alive
- Disk Rate
- Net Usage
Мониторинг по умолчанию для виртуальных машин
- CPU Usage
- Memory Usage
- Tools Running Status
- Host Alive
- Disk Free
- Disk Read Latency
- Disk Write Latency
- Data received
- Data transmitted
- Net Usage
В следующем разделе подробно описаны все доступные модули и информация, сообщаемая каждым из них.
Модули агентов виртуальной архитектуры VMware
Некоторые модули могут быть недоступны в зависимости от версии VMware и от конфигурации среды. В следующих таблицах описаны различные доступные модули характеристики их доступности.
Плагин позволяет настраивать пользовательские Performance Counters для хостов ESX и виртуальных машин. Вы можете посмотреть, как это делается, в разделе, который подробно описывает содержимое конфигурационного файла.
Модули для агентов типа Datacenter
Модуль | Описание | Версия API | Доступность |
---|---|---|---|
Ping | Проверка Ping на устройстве с поддержкой vCenter | Все | Всегда |
Check 443 port | Проверка порта 443 устройства, которое поддерживает vCenter | Все | Всегда |
Модули для агентов типа Datastore
Модуль | Описание | Версия API | Доступность |
---|---|---|---|
Capacity | Максимальная емкость хранилища данных Datastore в байтах | Все | Всегда |
Free Space | Процент свободного пространства в Datastore | Все | Всегда |
Disk Overallocation | Процент избыточного распределения дисков | ≥v4.0 | Всегда |
Free Space Bytes | Объем свободного пространства в байтах | Все | Всегда |
Модули для агентов типа host ESXi
Модуль | Описание | Версия API | Доступность |
---|---|---|---|
Boot Time | Последняя дата включения хоста | Все | Всегда |
CPU Info [x] | Общая информация о процессоре (один модуль создается для каждого процессора ESXi) | Все | Если подключено |
Memory Size | Общий объем физической памяти хоста в байтах | Все | Если подключено |
Overall CPU Usage | Сумма использования всех процессоров в МГц | Все | Если подключено |
Overall Memory Usage | Общее использование памяти хостами VMware | Все | Если подключено |
Power State | Состояние питания хоста | ≥v2.5 | Всегда |
SSL Thumbprint | Отпечаток SSL хоста | ≥v4.0 | Если настроено |
Uptime | Время работы хоста в секундах | ≥v4.1 | Если подключено |
VNIC Info [x] | Информация о виртуальных сетевых интерфейсах хоста | Все | Если подключено и настроено |
Host Alive | Модуль равен 1, если ESX подключен, и равен 0 в противном случае. | Все | Всегда |
Connection State | Состояние соединения с хостом | Все | Всегда |
Disk Read | Скорость чтения с диска в Кбит/с | Все | Уровень статистики ≥2 |
Disk Write | Скорость записи на диск Кбит/с | Все | Уровень статистики ≥2 |
Disk Read Latency | Задержка чтения с диска в миллисекундах | Все | Уровень статистики ≥2 |
Disk Write Latency | Задержка записи на диск в миллисекундах | Все | Уровень статистики ≥2 |
Data received | Скорость Кбит/с, полученная от хоста | Все | Уровень статистики ≥2 |
Data transmitted | Скорость Кбит/с, отправляемая с хоста | Все | Уровень статистики ≥2 |
Packages Received | Количество пакетов, полученных в интервале | Все | Уровень статистики ≥2 |
Packages Transmitted | Количество пакетов, отправленных в интервале | Все | Уровень статистики ≥2 |
CPU Usage | Процент использования процессора | Все | Уровень статистики ≥2 |
Memory Usage | Процент использования оперативной памяти | Все | Уровень статистики ≥2 |
Net Usage | Сетевые данные, полученные и отправленные со всех NIC | Все | Уровень статистики ≥2 |
Disk Rate | Скорость ввода/вывода в КБ/сек | Все | Уровень статистики ≥2 |
Max. Disk Latency | Максимальная задержка всех дисков | Все | Уровень статистики ≥2 |
HA Status | Статус хоста HA | ≥v5.0 | Если настроено |
Sensor* | Состояние аппаратных датчиков (один модуль на датчик) | Все | ESXi >= 3.5 |
Модули для Агентов типа виртуальной машины
Эти модули предлагают информацию с точки зрения архитектуры VMware®. Если вы хотите отслеживать другие параметры, связанные с виртуальной машиной, вам следует рассмотреть другие варианты, такие как Мониторинг с программными Агентами или Удаленный мониторинг
Модуль | Описание | Версия API | Доступность |
---|---|---|---|
Boot Time | Последняя дата включения виртуальной машины | Все | Если подключено |
Connection State | Состояние соединения | Все | Всегда |
Consumed Overhead Memory | Объем памяти, потребляемой виртуальной машиной в МБ | ≥v4.0 | Если настроено |
CPU Allocation | Информация о ресурсах, выделенных центральному процессору виртуальной машины | Все | Если настроено |
Disk Free [x] | Процент свободного дискового пространства на виртуальной машине. (Для каждого диска, на котором находится виртуальная машина, будет один модуль.) | Все | Если настроено |
Guest State | Режим работы операционной системы guest | Все | Если настроено |
Host Info | Информация о хосте VMware | Все | Если настроено |
Host Alive | Модуль, который равен 1, если виртуальная машина запущена, и 0 в противном случае. | Все | Всегда |
Host Memory Usage | Память, потребляемая виртуальной машиной в МБ | Все | Если подключено |
Host Name | Связанное имя хоста | Все | Если настроено |
IP Address [x] | IP-адрес машины. (Будет отображаться по одному доступному сетевому интерфейсу.) | ≥v4.1 | Если настроено |
MAC Address [x] | MAC-адрес машины. (Будет отображаться по одному доступному сетевому интерфейсу.) | Все | Если настроено |
Max CPU Usage | Верхний предел использования ЦП виртуальной машины | Все | Если подключено |
Max Memory Usage | Верхний предел использования оперативной памяти виртуальной машины | Все | Если подключено |
Memory Allocation | Предел ресурсов памяти | Все | Если настроено |
Memory Overhead | Объем памяти, используемой виртуальной машиной сверх требований операционной системы guest, в байтах. | Все | Если настроено |
Overall CPU Demand | Основные статистические данные о производительности процессора в МГц | ≥v4.0 | Если подключено |
Overall CPU Usage | Основная статистика использования процессора в МГц | Все | Если подключено |
Power State | Текущее состояние виртуальной машины | Все | Всегда |
Private Memory | Объем памяти в МБ, предоставленный виртуальной машине из собственной памяти | ≥v4.0 | Если подключено |
Shared Memory | Объем памяти в МБ, предоставляемый виртуальной машине в общей памяти | ≥v4.0 | Если подключено |
Tools Running Status | Текущее состояние запущенных инструментов VMware Tools, установленных в операционной системе guest | ≥v4.0 | Если настроено |
Trigger Alarm State | Состояние сигналов предупреждения VMware | Все | Если настроено |
Uptime Seconds | Время работы виртуальной машины в секундах | ≥v4.1 | Если подключено |
Virtual Image Path | Путь к файлу конфигурации виртуальной машины (.vmx) | Все | Всегда |
Disk Read | Скорость чтения с диска в Кбит/с | Все | Уровень статистики ≥2 |
Disk Write | Скорость записи на диск Кбит/с | Все | Уровень статистики ≥2 |
Disk Read Latency | Задержка чтения с диска в миллисекундах | Все | Уровень статистики ≥2 |
Disk Write Latency | Задержка записи на диск в миллисекундах | Все | Уровень статистики ≥2 |
Data received | Скорость Кбит/с, полученная от хоста | Все | Уровень статистики ≥2 |
Data transmitted | Скорость Кбит/с, отправляемая с хоста | Все | Уровень статистики ≥2 |
Packages Received | Количество пакетов, полученных в интервале | Все | Уровень статистики ≥2 |
Packages Transmitted | Количество пакетов, отправленных в интервале | Все | Уровень статистики ≥2 |
CPU Usage | Процент использования процессора | Все | Уровень статистики ≥2 |
Memory Usage | Процент использования оперативной памяти | Все | Уровень статистики ≥2 |
Net Usage | Сетевые данные, полученные и отправленные со всех NIC | Все | Уровень статистики ≥2 |
Disk Rate | Скорость ввода/вывода в КБ/сек | Все | Уровень статистики ≥2 |
Max. Disk Latency | Максимальная задержка всех дисков | Все | Уровень статистики ≥2 |
HeartBeat | Количество Heartbeat-сообщений виртуальной машины | Все | Уровень статистики ≥2 |
CPU Ready | Процент времени, в течение которого машина находится в списке, но не поставлена в очередь на выполнение на физическом процессоре | Все | Уровень статистики ≥2 |
Number Snapshots | Количество снапшотов для виртуальной машины (этот модуль может влиять на производительность мониторинга, поэтому рекомендуется запускать его с большим значением интервала, например, каждый час). | Все | Если настроено |
HA Status | Статус HA для виртуальной машины | ≥v5.0 | Если настроено |
Некоторые модули требуют установки VMware tools®.
Мониторинг событий VMware
Эта функция делает копию событий, присутствующих в vCenter VMware® в список событий Pandora FMS.
Эти события становятся частью обычного потока событий Pandora FMS и автоматически ассоциируются с агентом, представляющим vCenter, из которого они исходят (если агент существует на момент создания события).
В процессе создания дампа событий учитывается информация и степень серьезности, которые VMware® указывает при создании события, поэтому события с критическим, предупреждающим или информативным уровнем серьезности сохранят эти уровни в Pandora FMS. На следующем изображении показан пример подробной информации о дампе событий из VMware в Pandora FMS.
Со всеми событиями, присутствующими в Pandora FMS, можно выполнять все доступные действия по управлению событиями, такие как: создание предупреждений, настройка фильтров, открытие инцидентов и т.д.
Управление и визуализация виртуальной архитектуры VMware
Вместе с плагином VMware® распространяются два расширения: VMware Manager® и VMware View®. VMware View® позволяет визуализировать все компоненты архитектуры VMware® в удобном виде. Кроме того, с помощью VMware Manager® вы можете управлять большим количеством виртуальных машин, останавливая, запуская, сбрасывая или приостанавливая их активность из консоли Pandora FMS.
Использование VMware View
Чтобы начать использовать средство просмотра архитектуры VMware®, перейдите в раздел Monitoring → VMware view.
Если у вас нет устройства для мониторинга или вы не настроили API vCenter® и ESXi VMware® вы получите нечто похожее на следующее изображение:
Если плагин находится в рабочем состоянии, вы получите это сообщение (нажмите на Show):
Расширение VMware View® покажет вам карту, подобную приведенной ниже, со всей архитектурой VMware®.
Карта содержит элементы архитектуры VMware® (виртуальные машины, ESX, DataStores и DataCenters) с различными иконками, которые их идентифицируют, а также состояние агентов Pandora FMS, которые представляют каждый элемент. Кроме того, показана взаимосвязь между виртуальными машинами, ESX и DataCenter. Таким образом можно быстро и просто посмотреть состояние архитектуры VMware®.
Это расширение имеет некоторые опции, которые помогают улучшить визуализацию архитектуры, скрывая элементы, увеличивая размер шрифта и позволяя увеличить масштаб, чтобы увидеть элементы с большей детализацией.
Используя приведенные выше параметры, вы можете показать только DataCenter и ESX.
VMware View Dashboards
VMware View® предоставляет два дополнительных вида в дополнение к виду топологической карты виртуальной архитектуры. Новые вкладки позволяют переключаться между различными видами VMware View®.
Первый вид - это общая приборная панель, где можно сразу увидеть общее состояние виртуальной архитектуры в цифрах, т.е. сколько виртуальных машин, хостов ESXi или DataStores имеют проблемы. Вы также сможете увидеть общие параметры производительности благодаря графикам, которые показывают 5 виртуальных машин, потребляющих больше всего памяти, процессора, диска и сети из всей виртуальной архитектуры.
Второй вид позволяет увидеть показатели производительности для каждого хоста ESX. В этом виде вы можете выбрать хост ESX, для которого будет загружена приборная панель, в которой будет отображаться статус хоста и виртуальных машин, а также некоторые показатели производительности, касающиеся использования процессора, памяти, диска и сети хоста ESXi. Кроме того, этот вид также предлагает несколько графиков, которые показывают виртуальные машины, потребляющие больше ресурсов (процессор, память, диск и сеть) выбранного хоста.
VMware View Options Tab
Расширение VMWare входит в комплект поставки Pandora FMS Console Enterprise. В нем есть панель конфигурации для настройки параметров панелей и карт:
- Вы можете настроить пороги вида (минимум - максимум) графиков приборных панелей.
- Вы можете настроить параметры просмотра карты по умолчанию.
- Содержит ссылку на систему управления конфигурацией.
Доступно во вкладке опций VMWare View®:
Использование расширения VMware Manager из Агентов
Для использования расширения VMware® Manager необходимо перейти к просмотру операций агента, соответствующего виртуальной машине в этой архитектуре. Внутри этого просмотра вы увидите значок с символом VMware, который соответствует расширению.
Расширение VMware® Manager позволяет управлять виртуальными машинами из консоли Pandora FMS. Расширение показывает текущее состояние виртуальной машины с помощью цветового кода:
- Зеленый = Включена.
- Оранжеваый = На паузе.
- Серый = Остановлена.
Кроме того, в комбинированном режиме оно показывает доступные состояния и позволяет изменить состояние виртуальной машины на выбранное, нажав кнопку Change Status.
Выбор состояния Stop и нажатие на Change status:
Это приведет к остановке машины, а вид расширения VMware Manage изменится и покажет, что машина теперь остановлена:
Данное расширение требует установки VMware SDK® для Perl на той же машине, которая поддерживает Консоль Pandora FMS; без этого требования расширение работать не будет
Если вы настроили мониторинг с помощью RENAME
, эта утилита не будет работать с переименованными целями.
Конфигурация плагина VMware
По умолчанию VMware плагин обнаруживает все объекты и добавляет проверки по умолчанию. С помощью конфигурационного файла вы можете настроить мониторинг и выбрать, какие переменные вы хотите отслеживать.
Файл конфигурации содержит всю необходимую для проведения мониторинга информацию, сгруппированную в следующих разделах: Configuration, Rename, Reject, Datacenter, Datastore, ESX, VM.
Все ошибки, связанные с конфигурационным файлом, отображаются в журнале ошибок сервера Pandora FMS, а также в средстве просмотра событий Консоли Pandora FMS. Поэтому вы можете узнать, есть ли какие-либо ошибки в конфигурационном файле, проверив любой из этих двух источников.
Файл Конфигурации
Общая конфигурация
Общая конфигурация определяется токеном Configuration и содержит следующие параметры:
- server: IP-адрес vCenter.
- user: Пользователь vCenter.
- pass: Пароль для доступа к vCenter.
- datacenter: Центр обработки данных для мониторинга.
- temporal: Временный каталог.
- logfile: Расположение файла журнала.
- entities_list: Расположение файла, содержащего список объектов, на которых проводится мониторинг.
- transfer_mode: Режим передачи для XML, он может быть через tentacle или локальным.
- tentacle: Отправка XML-файлов на сервер Pandora FMS, используя протокол Tentacle.
- local: Копирует файлы в локальную папку; Агент должен быть запущен на той же машине, что и локальная папка.
- tentacle_ip: IP-адрес сервера Pandora FMS для отправки информации.
- tentacle_port: Порт сервера Pandora FMS, на который отправляется информация (по умолчанию 41121).
- tentacle_opts: Дополнительные опции для отправки с Tentacle (по умолчанию их нет).
- local_folder: Целевой каталог для копирования XML при включенном локальном режиме.
- pandora_url: URL консоли Pandora FMS (например:
http://192.168.70.81/pandora_console ).
- api_pass: Пароль API консоли Pandora FMS.
- api_user: Пользователь консоли Pandora FMS.
- api_user_pass: Пароль пользователя консоли Pandora FMS.
- retry_send: Включает (1) или отключает (0) пересылку файлов .data в каталоге <i>temporal</i>
- event_mode: Флаг, активирующий режим сбора событий. Если он равен 1, то активируется, если 0 - деактивируется.
- event_pointer_file: Расположение временного файла, в котором хранится указатель для сбора событий.
- verbosity: Уровень лога (0 только ошибки, препятствующие работе плагина, 1 все ошибки).
- threads: Количество потоков плагина (по умолчанию 1).
- interval: Диапазон агентов, представляющих объекты VMware®.
Пример такого раздела в конфигурационном файле может выглядеть следующим образом:
Configuration server 192.168.70.249 user Administrator pass S1stemas datacenter artica temporal /tmp logfile /tmp/vmware_plugin.log entities_list /tmp/vmware_entities_list.txt transfer_mode tentacle tentacle_ip 192.168.70.81 tentacle_port 41121 tentacle_opts local_folder /var/spool/pandora/data_in pandora_url http://192.168.70.81/pandora_console api_pass 1234 api_user admin api_user_pass pandora event_mode 0 event_pointer_file /tmp/vmware_events_pointer.txt
Если вы используете плагин в системах MS Windows®, необходимо будет заменить все пути к файлам на пути, совместимые с Windows®.
Сканирование объектов
Чтобы использовать эту функцию в Discovery, добавьте нужную конфигурацию в Extra settings.
Из-за размеров инфраструктур VMware, характерных для клиентов Enterprise, полное сканирование всех доступных объектов при каждом запуске может вызвать проблемы с производительностью.
Чтобы избежать этой ситуации, плагин мониторинга VMware имеет файл объектов ( entities_list
), в котором хранится список объектов, сканируемых при первом запуске.
Пока существует этот файл, мониторинг ограничен перечисленными в нем объектами.
Если вам необходимо периодическое сканирование инфраструктуры VMware, вы можете удалять этот файл время от времени (например, каждый час) с помощью cron системы.
Переименование объектов
Чтобы использовать эту функцию в Discovery, добавьте нужную конфигурацию в Extra settings.
Переименование объектов осуществляется с помощью токена RENAME и позволяет вам переименовывать объекты, обнаруженные плагином. При использовании этой функции Агенты, созданные в Pandora FMS, будут отображаться с новым присвоенным именем. Структура данного раздела выглядит следующим образом:
<настоящее имя> TO <новое имя>
Пример конфигурации этого раздела может быть следующим:
#Rename entities Rename Debian 11 TO Virtual Machine 1 RedHat 12 TO Web server ESX Workstation TO Host Work Sales
Исключение объектов
Чтобы использовать эту функцию в Discovery, добавьте нужную конфигурацию в Extra settings.
Плагин позволяет исключать объекты по типу или по отдельности, оба варианта описаны ниже.
Отбрасывание объектов по типу осуществляется с использованием токена REJECT. В этом разделе вы можете отбрасывать объекты в соответствии с их типом; например, все виртуальные машины или все хосты ESX. Возможные значения, которые может принимать этот раздел, следующие: all_datastore, all_datacenter, all_esx, all_vm.
Конфигурация этой секции, которая отбрасывает все объекты, будет выглядеть следующим образом:
#Dismissed entities Reject all_datastore all_datacenter all_esx all_vm
Для выполнения отбрасывания объектов по отдельности необходимо будет удалить их из файла объектов, созданного плагином. Плагин создает этот файл в месте, указанном в параметре entities_list (по умолчанию /tmp/vmware_entities_list.txt
). Плагин заполняет содержимое этого файла при первом запуске, или когда его не существует, создавая список всех обнаруженных объектов. Примером файла может быть следующее:
Datacenter artica Datastore datastore_1 datastore2 ESX 192.168.70.252 VM Pandora FMS 4.0.3 Debian2 Debian3 Debian4 Redhat debian5 Debian6 Debian8 Debian7 Debian11 Debian10 Debian9 NSM Pandora vcenter suse11.2
Файл конфигурации разделен на несколько токенов: Datacenter, Datastore, ESX и VM, где перечислены различные объекты. После создания файла конфигурации плагин будет считывать из этого файла объекты для мониторинга. Чтобы отбросить объект, достаточно удалить его из этого файла. Если, например, вам не нужно проводить мониторинг объектов: Debian2, datastore2, NSM, suse11.2 и 192.168.70.252, конфигурационный файл будет выглядеть следующим образом:
Datacenter artica Datastore datastore_1 ESX VM Pandora FMS 4.0.3 Debian3 Debian4 Redhat debian5 Debian6 Debian8 Debian7 Debian11 Debian10 Debian9 Pandora vcenter
Эта функция позволяет распределить нагрузку на мониторинг, ограничивая количество объектов, отслеживаемых при каждом выполнении плагина. Ниже описаны различные методы распределения нагрузки.
Конфигурация мониторинга
Чтобы использовать эту функцию в Discovery, добавьте нужную конфигурацию в Extra settings.
В следующих разделах файла настраиваются модули, созданные для каждого типа объекта. В разделах используются токены. Datacenter, Datastore, ESX, VM. В этих разделах вы можете включить/выключить модули для мониторинга. В следующем примере мы создали конфигурацию, выбрав модули, которые мы хотим создать для ESX и виртуальных машин:
... #ESX Modules ESX cpuUsagePercent disabled diskRead enabled diskWrite enabled #VM Modules VM diskReadLatency disabled diskWriteLatency disabled diskRate enabled ...
Каждая строка конфигурации соответствует одному модулю. В приведенном примере модули будут созданы со значениями по умолчанию, но можно настроить имя, описание и ограничения для Предупреждающего и Критического состояний Модуля. Примером такой конфигурации может быть следующее:
... #VM Modules ESX diskReadLatency disabled diskWriteLatency disabled diskRate name = Tasa Disco; desc = Tasa Lec/Esc disco; limits_warn = 5 10; limits_crit = 0 4 ...
Для конфигурации модуля доступны следующие опции:
- <модуль> disabled: Модуль НЕ будет создан.
- <модуль> enabled: Модуль БУДЕТ создан (со значениями по умолчанию).
- <модуль> name = <имя>; desc = <описание>; limits_warn <lim_warn>; limits_crit <lim_crit» Модуль будет создан с указанным именем и описанием, а также будут определены пороговые значения для самого высокого и самого низкого состояний Предупреждения и Критического.
Очень важно обратить внимание на структуру строк конфигурационного файла и особенно проверить, чтобы символ ;
был присоединен к имени и описанию Модуля. Эти две строки НЕ РАВНЫ (см. пробелы перед символом ; ):
diskRate name = Tasa Disco; desc = Tasa Lec/Esc disco; limits_warn = 5 10; limits_crit = 0 4 diskRate name = Tasa Disco ; desc = Tasa Lec/Esc disco ; limits_warn = 5 10; limits_crit = 0 4
На модули ссылаются по их короткому имени - эквивалентному имени, которое легче набрать в командной строке. Таблица соответствия кратких и расширенных названий находится в следующем разделе.
Проанализируйте пример конфигурации, приведенный выше. Модуль Disk Rate был настроен на создание со следующими значениями:
* Имя: Скорость Диска * Описание: Скорость Записи/Чтения Диска * Min Warning: 5 * Max Warning: 10 * Min Critical: 0 * Max Critical: 4
Есть модули, которые генерируются динамически, например, связанные с дисками или сетевыми интерфейсами. Для этих метрик плагин создает Модуль для каждого обнаруженного элемента. Эти модули обычно имеют специальные названия, например, в Pandora FMS:
Disk Free [0] Disk Free [1] Disk Free [2] ...
В этих случаях, поскольку имя имеет динамическую часть, допускается использование макроса %s
, который будет заменен на переменную часть имени Модуля. Пример динамической конфигурации модуля выглядит следующим образом:
diskFree name = Disk (%s) free space; desc = Free space for disk; limits_warn = 0 0; limits_crit = 0 0
В этом случае имя модуля по умолчанию:
Disk Free [0]
И оно будет переименовано в:
Disk (0) free space
Также можно настроить текстовые строки для границ предупреждающего и критического состояний модулей. Конфигурация будет выглядеть следующим образом:
powerState name = Estado funcionamiento; desc = Estado funcionamiento VM; limits_warn = .*suspended.*; limits_crit = .*poweredOff.*
Можно настроить регулярные выражения для обеспечения большей гибкости при установке ограничений.
Пользовательские метрики производительности
Чтобы использовать эту функцию в Discovery, добавьте нужную конфигурацию в Extra settings.
В этом разделе можно настроить новые модули, связанные с Performance Counters для виртуальных машин и ESX. Для настройки нового модуля производительности необходимо использовать следующую структуру:
custom_performance type = mem; metric = swapinRate; module_type = generic_data; name = Swap In Rate; desc = Swap In Rate for host; limits_warn = 0 0; limits_crit = 0 0
Настраиваются следующие параметры:
- type: Тип метрик, подлежащих мониторингу. Виды метрики следующие:
- cpu: Характеристики центрального процессора.
- mem: Память.
- disk: Диск, хранилище.
- net: Сеть.
- sys: Система.
- metric: Метрика для мониторинга (ниже объясняется, где можно найти наиболее доступные метрики).
- module_type: Тип Модуля Pandora FMS (например: generic_data).
- name: Название Модуля.
- desc: Описание Модуля.
- limits_warn: Пределы для состояния Предупреждение.
- limits_crit: Пределы для Критического состояния.
Вы можете ознакомиться с наиболее доступными техниками для каждого типа в разделе Performance каждого объекта. Этот вид находится внутри vCenter и показывает метрики производительности, которые можно отслеживать с помощью плагина. VMware®. Например, на следующем изображении показан вид de Performance для хоста ESX.
Чтобы увидеть полный список всех инструментов в соответствии с их типом, нажмите на кнопку Advanced, а затем на кнопку Char option. Вы увидите список со всеми типами инструментов и соответствующими инструментами каждого типа:
Для каждого типа метрики появится ряд счетчиков, которые являются переменными, которые мы сможем отслеживать с помощью Pandora FMS. Для мониторинга переменной нам нужен ее Internal Name. Кроме того, необходимо убедиться, что уровень статистики, настроенный в vCenter, позволяет отображать искомую переменную, сравнив ее с полем Collection Level метрики.
Например, если вам нужно посмотреть использование процессора хоста ESX, мы найдем переменные типа cpu для ESX и из доступных выберем utilization. В конфигурационный файл (в данном случае в раздел ESX) нужно добавить следующую строку:
custom_performance type = cpu; metric = utilization; module_type = generic_data; name = CPU Utilization; desc = CPU Utilization for ESX; limits_warn = 0 0; limits_crit = 0 0
Мониторинг нескольких Центров Обработки Данных с помощью одного и того же агента
Каждый модуль плагина, настроенный в Агенте, контролирует один ЦОД, поэтому если вы хотите контролировать несколько ЦОД с помощью одного и того же Программного Агента Pandora FMS, необходимо принять следующие меры.
- Необходимо добавить
module_plugin
для каждого ЦОД, который необходимо контролировать; например:
module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter1.conf module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter2.conf
- В каждом файле конфигурации необходимо будет изменить параметры: logfile, entities_list, event_pointer_file. Конфигурационные файлы будут выглядеть следующим образом:
vmware-plugin-datacenter1.conf
... logfile /tmp/vmware_plugin_datacenter1.log entities_list /tmp/vmware_entities_list_datacenter1.txt event_pointer_file /tmp/vmware_events_pointer_datacenter1.txt ...
vmware-plugin-datacenter2.conf
... logfile /tmp/vmware_plugin_datacenter2.log entities_list /tmp/vmware_entities_list_datacenter2.txt event_pointer_file /tmp/vmware_events_pointer_datacenter2.txt ...
- Если вы также хотите сделать копию событий, необходимо иметь еще два модуля плагина с соответствующими конфигурационными файлами и активировать флаг.
event_mode
. Конфигурация module_plugin будет выглядеть следующим образом:
module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter1.conf module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter1-events.conf module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter2.conf module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter2-events.conf
Разделите нагрузку по мониторингу между несколькими серверами Pandora FMS
Параметры конфигурационного файла плагина позволяют легко распределить нагрузку мониторинга между несколькими серверами Pandora FMS. Возьмем, к примеру, следующую структуру среды виртуализации:
DC | |- Datastore_1 |- DataStore_2 | |- ESX_1 |- mv1.1 |- mv1.2 |- mv1.3 |- ESX_2 |- mv2.1 |- mv2.2 |- mv2.3
Он имеет два сервера Pandora FMS для мониторинга. Простым способом разделения нагрузки может быть мониторинг центра данных, хранилищ данных и ESX на первом сервере и всех виртуальных машин на втором сервере. Конфигурационные файлы плагина будут следующими:
Сервер 1:
Reject all_vm
Сервер 2:
Reject all_datacenter all_datastore all_esx
Сервер 1 следит за всем за исключением виртуальных машин, а Сервер 2 только за виртуальными машинами.
Другим способом распределения нагрузки может быть разделение мониторинга по ESX; первый сервер Pandora FMS будет отслеживать все, что связано с первым сервером ESX, а второй - все, что связано со вторым ESX. Для этого мы разделим файл entities_list.txt
на два файла и настроим два выполнения плагина в разных агентах. Файлы entities_list.txt
будут выглядеть следующим образом:
Сервер 1:
Datacenter DC Datastore Datastore_1 ESX ESX_1 VM mv1.1 mv1.2 mv1.3
Сервер 1 пропускает все, что связано со второй группой объектов VMware, поэтому он отвечает за мониторинг половины среды.
Сервер 2:
Datastore DataStore_2 ESX ESX_2 VM mv2.1 mv2.2 mv2.3
Сервер 2 опускает все, что связано с первой группой объектов VMware в дополнение к ЦОД, поскольку за ним следит сервер 1.
Конфигурация отбрасываемых объектов очень гибкая и позволяет разделить нагрузку, назначая определенное количество объектов каждому агенту Pandora FMS.
Примеры файлов конфигурации
Архив со всеми деактивированными модулями
#These lines are comments #Datacenter Modules Datacenter ping disabled check443 disabled #Datastore Modules Datastore capacity disabled freeSpace disabled overallocation disabled freeSpaceBytes disabled #ESX Modules ESX bootTime disabled cpuInfo disabled memorySize disabled overallCpuUsage disabled overallMemoryUsage disabled powerState disabled sslThumbprint disabled uptime disabled vnicInfo disabled hostAlive disabled connectionState disabled diskRead disabled diskWrite disabled diskReadLatency disabled diskWriteLatency disabled netReceived disabled netTransmitted disabled netPkgRx disabled netPkgTx disabled cpuUsagePercent disabled memoryUsagePercent disabled netUsage disabled diskRate disabled maxDiskLatency disabled haStatus disabled #VM Modules VM bootTime disabled connectionState disabled consumedOverheadMemory disabled cpuAllocation disabled diskFree disabled guestState disabled host disabled hostAlive disabled hostMemoryUsage disabled hostName disabled ipAddress disabled macAddress disabled maxCpuUsage disabled maxMemoryUsage disabled memoryAllocation disabled memoryOverhead disabled overallCpuDemand disabled overallCpuUsage disabled powerState disabled privateMemory disabled sharedMemory disabled toolsRunningStatus disabled triggeredAlarmState disabled virtualImagePath disabled uptimeSeconds disabled diskRead disabled diskWrite disabled diskReadLatency disabled diskWriteLatency disabled netReceived disabled netTransmitted disabled netPkgRx disabled netPkgTx disabled cpuUsagePercent disabled memoryUsagePercent disabled netUsage disabled diskRate disabled maxDiskLatency disabled heartbeat disabled cpuReady disabled snapshotCounter disabled
Таблица соответствия кратких имен
datacenter
Полное Имя | Короткое Имя |
---|---|
Ping | ping |
Check 443 port | check443 |
Datastores
Полное Имя | Короткое Имя |
---|---|
Capacity | capacity |
Free Space | freeSpace |
Disk Overallocation | overallocation |
Free Space Bytes | freeSpaceBytes |
ESX
Полное Имя | Короткое Имя |
---|---|
Boot Time | bootTime |
CPU Info | cpuInfo |
Memory Size | memorySize |
Overall CPU Usage | overallCpuUsage |
Overall Memory Usage | overallMemoryUsage |
Power State | powerState |
SSL Thumbprint | sslThumbprint |
Uptime | uptime |
VNIC Info | vnicInfo |
Host Alive | hostAlive |
Connection State | connectionState |
Disk Read | diskRead |
Disk Write | diskWrite |
Disk Read Latency | diskReadLatency |
Disk Write Latency | diskWriteLatency |
Data received | netReceived |
Data transmitted | netTransmitted |
Packages Received | netPkgRx |
Packages Transmitted | netPkgTx |
CPU Usage | cpuUsagePercent |
Memory Usage | memoryUsagePercent |
Net Usage | netUsage |
Disk Rate | diskRate |
Max Disk Latency | maxDiskLatency |
HA Status | haStatus |
Sensor* | systemHealthInfo |
Виртуальные машины
Полное Имя | Короткое Имя |
---|---|
Boot Time | bootTime |
Connection State | connectionState |
Consumed Overhead Memory | consumedOverheadMemory |
CPU Allocation | cpuAllocation |
Disk Free | diskFree |
Guest State | guestState |
Host Info | host |
Host Alive | hostAlive |
Host Memory Usage | hostMemoryUsage |
Host Name | hostName |
IP Address | ipAddress |
MAC Address | macAddress |
Max CPU Usage | maxCpuUsage |
Max Memory Usage | maxMemoryUsage |
Memory Allocation | memoryAllocation |
Memory Overhead | memoryOverhead |
Overall CPU Demand | overallCpuDemand |
Overall CPU Usage | overallCpuUsage |
Power State | powerState |
Private Memory | privateMemory |
Shared Memory | sharedMemory |
Tools Running Status | toolsRunningStatus |
Trigger Alarm State | triggeredAlarmState |
Uptime Seconds | uptimeSeconds |
Virtual Image Path | virtualImagePath |
Disk Read | diskRead |
Disk Write | diskWrite |
Disk Read Latency | diskReadLatency |
Disk Write Latency | diskWriteLatency |
Data received | netReceived |
Data transmitted | netTransmitted |
Packages Received | netPkgRx |
Packages Transmitted | netPkgTx |
CPU Usage | cpuUsagePercent |
Memory Usage | memoryUsagePercent |
Net Usage | netUsage |
Disk Rate | diskRate |
Max Disk Latency | maxDiskLatency |
HeartBeat | heartbeat |
CPU Ready | cpuReady |
Number Snapshots | snapshotCounter |
HA Status | haStatus |
Таблица событий
Этот список событий предоставляется для облегчения задачи настройки оповещений о событиях в Pandora FMS. Полный и актуальный перечень всех возможных событий можно найти в документации VMware
Событие | Степень тяжести | Тип события | Группа | |
---|---|---|---|---|
An account was created on host {host.name} | Informational | System | All | |
Account {account} was removed on host {host.name} | Informational | System | All | |
An account was updated on host {host.name} | Informational | System | All | |
The default password for the root user on the host {host.name} has not been changed | Informational | System | All | |
Alarm '{alarm.name}' on {entity.name} triggered an action | Informational | System | All | |
Created alarm '{alarm.name}' on {entity.name} | Informational | System | All | |
Alarm '{alarm.name}' on {entity.name} sent email to {to} | Informational | System | All | |
Alarm '{alarm.name}' on {entity.name} cannot send email to {to} | Critical | System | All | |
Reconfigured alarm '{alarm.name}' on {entity.name} | Informational | System | All | |
Removed alarm '{alarm.name}' on {entity.name} | Informational | System | All | |
Alarm '{alarm.name}' on {entity.name} ran script {script} | Informational | System | All | |
Alarm '{alarm.name}' on {entity.name} did not complete script: {reason.msg} | Critical | System | All | |
Alarm '{alarm.name}': an SNMP trap for entity {entity.name} was sent | Informational | System | All | |
Alarm '{alarm.name}' on entity {entity.name} did not send SNMP trap: {reason.msg} | Critical | System | All | |
Alarm '{alarm.name}' on {entity.name} changed from {[email protected]} to {[email protected]} | Informational | System | All | |
All running virtual machines are licensed | Informational | System | All | |
User cannot logon since the user is already logged on | Informational | System | All | |
Cannot login {userName}@{ipAddress} | Critical | System | All | |
The operation performed on host {host.name} in {datacenter.name} was canceled | Informational | System | All | |
Changed ownership of file name {filename} from {oldOwner} to {newOwner} on {host.name} in {datacenter.name}. | Informational | System | All | |
Cannot change ownership of file name {filename} from {owner} to {attemptedOwner} on {host.name} in {datacenter.name}. | Critical | System | All | |
Checked cluster for compliance | Informational | System | All | |
Created cluster {computeResource.name} in {datacenter.name} | Informational | System | All | |
Removed cluster {computeResource.name} in datacenter {datacenter.name} | Informational | System | All | |
Insufficient capacity in cluster {computeResource.name} to satisfy resource configuration in {datacenter.name} | Critical | System | All | |
Reconfigured cluster {computeResource.name} in datacenter {datacenter.name} | Informational | System | All | |
Configuration status on cluster {computeResource.name} changed from {[email protected]} to {[email protected]} in {datacenter.name} | Informational | System | All | |
Created new custom field definition {name} | Informational | System | All | |
Removed field definition {name} | Informational | System | All | |
Renamed field definition from {name} to {newName} | Informational | System | All | |
Changed custom field {name} on {entity.name} in {datacenter.name} to {value} | Informational | System | All | |
Cannot complete customization of VM {vm.name}. See customization log at {logLocation} on the guest OS for details. | Informational | System | All | |
An error occurred while setting up Linux identity. See log file '{logLocation}' on guest OS for details. | Critical | System | All | |
An error occurred while setting up network properties of the guest OS. See the log file {logLocation} in the guest OS for details. | Critical | System | All | |
Started customization of VM {vm.name}. Customization log located at {logLocation} in the guest OS. | Informational | System | All | |
Customization of VM {vm.name} succeeded. Customization log located at {logLocation} in the guest OS. | Informational | System | All | |
The version of Sysprep {sysprepVersion} provided for customizing VM {vm.name} does not match the version of guest OS {systemVersion}. See the log file {logLocation} in the guest OS for more information. | Critical | System | All | |
An error occurred while customizing VM {vm.name}. For details reference the log file {logLocation} in the guest OS. | Critical | System | All | |
dvPort group {net.name} in {datacenter.name} was added to switch {dvs.name}. | Informational | System | All | |
dvPort group {net.name} in {datacenter.name} was deleted. | Informational | System | All | |
Informational | System | All | ||
dvPort group {net.name} in {datacenter.name} was reconfigured. | Informational | System | All | |
dvPort group {oldName} in {datacenter.name} was renamed to {newName} | Informational | System | All | |
HA admission control disabled on cluster {computeResource.name} in {datacenter.name} | Informational | System | All | |
HA admission control enabled on cluster {computeResource.name} in {datacenter.name} | Informational | System | All | |
Re-established contact with a primary host in this HA cluster | Informational | System | All | |
Unable to contact a primary HA agent in cluster {computeResource.name} in {datacenter.name} | Critical | System | All | |
All hosts in the HA cluster {computeResource.name} in {datacenter.name} were isolated from the network. Check the network configuration for proper network redundancy in the management network. | Critical | System | All | |
HA disabled on cluster {computeResource.name} in {datacenter.name} | Informational | System | All | |
HA enabled on cluster {computeResource.name} in {datacenter.name} | Informational | System | All | |
A possible host failure has been detected by HA on {failedHost.name} in cluster {computeResource.name} in {datacenter.name} | Critical | System | All | |
Host {isolatedHost.name} has been isolated from cluster {computeResource.name} in {datacenter.name} | Warning | System | All | |
Created datacenter {datacenter.name} in folder {parent.name} | Informational | System | All | |
Renamed datacenter from {oldName} to {newName} | Informational | System | All | |
Datastore {datastore.name} increased in capacity from {oldCapacity} bytes to {newCapacity} bytes in {datacenter.name} | Informational | System | All | |
Removed unconfigured datastore {datastore.name} | Informational | System | All | |
Discovered datastore {datastore.name} on {host.name} in {datacenter.name} | Informational | System | All | |
Multiple datastores named {datastore} detected on host {host.name} in {datacenter.name} | Critical | System | All | |
<internal> | Informational | System | All | |
File or directory {sourceFile} copied from {sourceDatastore.name} to {datastore.name} as {targetFile} | Informational | System | All | |
File or directory {targetFile} deleted from {datastore.name} | Informational | System | All | |
File or directory {sourceFile} moved from {sourceDatastore.name} to {datastore.name} as {targetFile} | Informational | System | All | |
Reconfigured Storage I/O Control on datastore {datastore.name} | Informational | System | All | |
Configured datastore principal {datastorePrincipal} on host {host.name} in {datacenter.name} | Informational | System | All | |
Removed datastore {datastore.name} from {host.name} in {datacenter.name} | Informational | System | All | |
Renamed datastore from {oldName} to {newName} in {datacenter.name} | Informational | System | All | |
Renamed datastore from {oldName} to {newName} in {datacenter.name} | Informational | System | All | |
Disabled DRS on cluster {computeResource.name} in datacenter {datacenter.name} | Informational | System | All | |
Enabled DRS on {computeResource.name} with automation level {behavior} in {datacenter.name} | Informational | System | All | |
DRS put {host.name} into standby mode | Informational | System | All | |
DRS is putting {host.name} into standby mode | Informational | System | All | |
DRS cannot move {host.name} out of standby mode | Critical | System | All | |
DRS moved {host.name} out of standby mode | Informational | System | All | |
DRS is moving {host.name} out of standby mode | Informational | System | All | |
DRS invocation not completed | Critical | System | All | |
DRS has recovered from the failure | Informational | System | All | |
Unable to apply DRS resource settings on host {host.name} in {datacenter.name}. {reason.msg}. This can significantly reduce the effectiveness of DRS. | Critical | System | All | |
Resource configuration specification returns to synchronization from previous failure on host '{host.name}' in {datacenter.name} | Informational | System | All | |
{vm.name} on {host.name} in {datacenter.name} is now compliant with DRS VM-Host affinity rules | Informational | System | All | |
{vm.name} on {host.name} in {datacenter.name} is violating a DRS VM-Host affinity rule | Informational | System | All | |
DRS migrated {vm.name} from {sourceHost.name} to {host.name} in cluster {computeResource.name} in {datacenter.name} | Informational | System | All | |
DRS powered On {vm.name} on {host.name} in {datacenter.name} | Informational | System | All | |
Virtual machine {macAddress} on host {host.name} has a duplicate IP {duplicateIP} | Informational | System | All | |
A vNetwork Distributed Switch {dvs.name} was created in {datacenter.name}. | Informational | System | All | |
vNetwork Distributed Switch {dvs.name} in {datacenter.name} was deleted. | Informational | System | All | |
vNetwork Distributed Switch event | Informational | System | All | |
The vNetwork Distributed Switch {dvs.name} configuration on the host was synchronized with that of the vCenter Server. | Informational | System | All | |
The host {hostJoined.name} joined the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. | Informational | System | All | |
The host {hostLeft.name} left the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. | Informational | System | All | |
The host {hostMember.name} changed status on the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. | Informational | System | All | |
The vNetwork Distributed Switch {dvs.name} configuration on the host differed from that of the vCenter Server. | Warning | System | All | |
vNetwork Distributed Switch {srcDvs.name} was merged into {dstDvs.name} in {datacenter.name}. | Informational | System | All | |
dvPort {portKey} was blocked in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. | Informational | System | All | |
The port {portKey} was connected in the vNetwork Distributed Switch {dvs.name} in {datacenter.name} | Informational | System | All | |
New ports were created in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. | Informational | System | All | |
Deleted ports in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. | Informational | System | All | |
The dvPort {portKey} was disconnected in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. | Informational | System | All | |
dvPort {portKey} entered passthrough mode in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. | Informational | System | All | |
dvPort {portKey} exited passthrough mode in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. | Informational | System | All | |
dvPort {portKey} was moved into the dvPort group {portgroupName} in {datacenter.name}. | Informational | System | All | |
dvPort {portKey} was moved out of the dvPort group {portgroupName} in {datacenter.name}. | Informational | System | All | |
The port {portKey} link was down in the vNetwork Distributed Switch {dvs.name} in {datacenter.name} | Informational | System | All | |
The port {portKey} link was up in the vNetwork Distributed Switch {dvs.name} in {datacenter.name} | Informational | System | All | |
Reconfigured ports in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. | Informational | System | All | |
dvPort {portKey} was unblocked in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. | Informational | System | All | |
The vNetwork Distributed Switch {dvs.name} in {datacenter.name} was reconfigured. | Informational | System | All | |
The vNetwork Distributed Switch {oldName} in {datacenter.name} was renamed to {newName}. | Informational | System | All | |
An upgrade for the vNetwork Distributed Switch {dvs.name} in datacenter {datacenter.name} is available. | Informational | System | All | |
An upgrade for the vNetwork Distributed Switch {dvs.name} in datacenter {datacenter.name} is in progress. | Informational | System | All | |
Cannot complete an upgrade for the vNetwork Distributed Switch {dvs.name} in datacenter {datacenter.name} | Informational | System | All | |
vNetwork Distributed Switch {dvs.name} in datacenter {datacenter.name} was upgraded. | Informational | System | All | |
Host {host.name} in {datacenter.name} has entered maintenance mode | Informational | System | All | |
The host {host.name} is in standby mode | Informational | System | All | |
Host {host.name} in {datacenter.name} has started to enter maintenance mode | Informational | System | All | |
The host {host.name} is entering standby mode | Informational | System | All | |
{message} | Critical | System | All | |
Host {host.name} in {datacenter.name} has exited maintenance mode | Informational | System | All | |
The host {host.name} could not exit standby mode | Critical | System | All | |
The host {host.name} is no longer in standby mode | Informational | System | All | |
The host {host.name} is exiting standby mode | Informational | System | All | |
Sufficient resources are available to satisfy HA failover level in cluster {computeResource.name} in {datacenter.name} | Informational | System | All | |
General event: {message} | Informational | System | All | |
Error detected on {host.name} in {datacenter.name}: {message} | Critical | System | All | |
Issue detected on {host.name} in {datacenter.name}: {message} | Informational | System | All | |
Issue detected on {host.name} in {datacenter.name}: {message} | Warning | System | All | |
User logged event: {message} | Informational | System | All | |
Error detected for {vm.name} on {host.name} in {datacenter.name}: {message} | Critical | System | All | |
Issue detected for {vm.name} on {host.name} in {datacenter.name}: {message} | Informational | System | All | |
Issue detected for {vm.name} on {host.name} in {datacenter.name}: {message} | Warning | System | All | |
The vNetwork Distributed Switch corresponding to the proxy switches {switchUuid} on the host {host.name} does not exist in vCenter Server or does not contain this host. | Informational | System | All | |
A ghost proxy switch {switchUuid} on the host {host.name} was resolved. | Informational | System | All | |
The message changed: {message} | Informational | System | All | |
{componentName} status changed from {oldStatus} to {newStatus} | Informational | System | All | |
Cannot add host {hostname} to datacenter {datacenter.name} | Critical | System | All | |
Added host {host.name} to datacenter {datacenter.name} | Informational | System | All | |
Administrator access to the host {host.name} is disabled | Warning | System | All | |
Administrator access to the host {host.name} has been restored | Warning | System | All | |
Cannot connect {host.name} in {datacenter.name}: cannot configure management account | Critical | System | All | |
Cannot connect {host.name} in {datacenter.name}: already managed by {serverName} | Critical | System | All | |
Cannot connect host {host.name} in {datacenter.name} : server agent is not responding | Critical | System | All | |
Cannot connect {host.name} in {datacenter.name}: incorrect user name or password | Critical | System | All | |
Cannot connect {host.name} in {datacenter.name}: incompatible version | Critical | System | All | |
Cannot connect host {host.name} in {datacenter.name}. Did not install or upgrade vCenter agent service. | Critical | System | All | |
Cannot connect {host.name} in {datacenter.name}: error connecting to host | Critical | System | All | |
Cannot connect {host.name} in {datacenter.name}: network error | Critical | System | All | |
Cannot connect host {host.name} in {datacenter.name}: account has insufficient privileges | Critical | System | All | |
Cannot connect host {host.name} in {datacenter.name} | Critical | System | All | |
Cannot connect {host.name} in {datacenter.name}: not enough CPU licenses | Critical | System | All | |
Cannot connect {host.name} in {datacenter.name}: incorrect host name | Critical | System | All | |
Cannot connect {host.name} in {datacenter.name}: time-out waiting for host response | Critical | System | All | |
Host {host.name} checked for compliance. | Informational | System | All | |
Host {host.name} is in compliance with the attached profile | Informational | System | All | |
Host configuration changes applied. | Informational | System | All | |
Connected to {host.name} in {datacenter.name} | Informational | System | All | |
Host {host.name} in {datacenter.name} is not responding | Critical | System | All | |
dvPort connected to host {host.name} in {datacenter.name} changed status | Informational | System | All | |
HA agent disabled on {host.name} in cluster {computeResource.name} in {datacenter.name} | Informational | System | All | |
HA is being disabled on {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} | Informational | System | All | |
HA agent enabled on {host.name} in cluster {computeResource.name} in {datacenter.name} | Informational | System | All | |
Enabling HA agent on {host.name} in cluster {computeResource.name} in {datacenter.name} | Warning | System | All | |
HA agent on {host.name} in cluster {computeResource.name} in {datacenter.name} has an error {message}: {[email protected]} | Critical | System | All | |
HA agent on host {host.name} in cluster {computeResource.name} in {datacenter.name} is configured correctly | Informational | System | All | |
Disconnected from {host.name} in {datacenter.name}. Reason: {[email protected]} | Informational | System | All | |
Cannot restore some administrator permissions to the host {host.name} | Critical | System | All | |
Host {host.name} has the following extra networks not used by other hosts for HA communication:{ips}. Consider using HA advanced option das.allowNetwork to control network usage | Critical | System | All | |
Cannot complete command 'hostname -s' on host {host.name} or returned incorrect name format | Critical | System | All | |
Maximum ({capacity}) number of hosts allowed for this edition of vCenter Server has been reached | Critical | System | All | |
The virtual machine inventory file on host {host.name} is damaged or unreadable. | Informational | System | All | |
IP address of the host {host.name} changed from {oldIP} to {newIP} | Informational | System | All | |
Configuration of host IP address is inconsistent on host {host.name}: address resolved to {ipAddress} and {ipAddress2} | Critical | System | All | |
Cannot resolve IP address to short name on host {host.name} | Critical | System | All | |
Host {host.name} could not reach isolation address: {isolationIp} | Critical | System | All | |
A host license for {host.name} has expired | Critical | System | All | |
Host {host.name} does not have the following networks used by other hosts for HA communication:{ips}. Consider using HA advanced option das.allowNetwork to control network usage | Critical | System | All | |
Host monitoring state in {computeResource.name} in {datacenter.name} changed to {[email protected]} | Informational | System | All | |
Host {host.name} currently has no available networks for HA Communication. The following networks are currently used by HA: {ips} | Critical | System | All | |
Host {host.name} has no port groups enabled for HA communication. | Critical | System | All | |
Host {host.name} currently has no management network redundancy | Critical | System | All | |
Host {host.name} is not in compliance with the attached profile | Critical | System | All | |
Host {host.name} is not a cluster member in {datacenter.name} | Critical | System | All | |
Insufficient capacity in host {computeResource.name} to satisfy resource configuration in {datacenter.name} | Critical | System | All | |
Primary agent {primaryAgent} was not specified as a short name to host {host.name} | Critical | System | All | |
Profile is applied on the host {host.name} | Informational | System | All | |
Cannot reconnect to {host.name} in {datacenter.name} | Critical | System | All | |
Removed host {host.name} in {datacenter.name} | Informational | System | All | |
Host names {shortName} and {shortName2} both resolved to the same IP address. Check the host's network configuration and DNS entries | Critical | System | All | |
Cannot resolve short name {shortName} to IP address on host {host.name} | Critical | System | All | |
Shut down of {host.name} in {datacenter.name}: {reason} | Informational | System | All | |
Configuration status on host {computeResource.name} changed from {[email protected]} to {[email protected]} in {datacenter.name} | Informational | System | All | |
Cannot synchronize host {host.name}. {reason.msg} | Critical | System | All | |
Cannot install or upgrade vCenter agent service on {host.name} in {datacenter.name} | Critical | System | All | |
The userworld swap is not enabled on the host {host.name} | Warning | System | All | |
Host {host.name} vNIC {vnic.vnic} was reconfigured to use dvPort {vnic.port.portKey} with port level configuration, which might be different from the dvPort group. | Informational | System | All | |
WWNs are changed for {host.name} | Warning | System | All | |
The WWN ({wwn}) of {host.name} conflicts with the currently registered WWN | Critical | System | All | |
Host {host.name} did not provide the information needed to acquire the correct set of licenses | Critical | System | All | |
{message} | Informational | System | All | |
Insufficient resources to satisfy HA failover level on cluster {computeResource.name} in {datacenter.name} | Critical | System | All | |
The license edition '{feature}' is invalid | Critical | System | All | |
License {feature.featureName} has expired | Critical | System | All | |
License inventory is not compliant. Licenses are overused | Critical | System | All | |
Unable to acquire licenses due to a restriction in the option file on the license server. | Critical | System | All | |
License server {licenseServer} is available | Informational | System | All | |
License server {licenseServer} is unavailable | Critical | System | All | |
Created local datastore {datastore.name} on {host.name} in {datacenter.name} | Informational | System | All | |
The Local Tech Support Mode for the host {host.name} has been enabled | Informational | System | All | |
Datastore {datastore} which is configured to back the locker does not exist | Warning | System | All | |
Locker was reconfigured from {oldDatastore} to {newDatastore} datastore | Informational | System | All | |
Unable to migrate {vm.name} from {host.name} in {datacenter.name}: {fault.msg} | Critical | System | All | |
Unable to migrate {vm.name} from {host.name} to {dstHost.name} in {datacenter.name}: {fault.msg} | Critical | System | All | |
Migration of {vm.name} from {host.name} to {dstHost.name} in {datacenter.name}: {fault.msg} | Warning | System | All | |
Cannot migrate {vm.name} from {host.name} to {dstHost.name} and resource pool {dstPool.name} in {datacenter.name}: {fault.msg} | Critical | System | All | |
Migration of {vm.name} from {host.name} to {dstHost.name} and resource pool {dstPool.name} in {datacenter.name}: {fault.msg} | Warning | System | All | |
Migration of {vm.name} from {host.name} in {datacenter.name}: {fault.msg} | Warning | System | All | |
Created NAS datastore {datastore.name} on {host.name} in {datacenter.name} | Informational | System | All | |
Cannot login user {userName}@{ipAddress}: no permission | Critical | System | All | |
No datastores have been configured on the host {host.name} | Informational | System | All | |
A required license {feature.featureName} is not reserved | Critical | System | All | |
Unable to automatically migrate {vm.name} from {host.name} | Informational | System | All | |
Non-VI workload detected on datastore {datastore.name} | Critical | System | All | |
Not enough resources to failover {vm.name} in {computeResource.name} in {datacenter.name} | Informational | System | All | |
The vNetwork Distributed Switch configuration on some hosts differed from that of the vCenter Server. | Warning | System | All | |
Permission created for {principal} on {entity.name}, role is {role.name}, propagation is {[email protected]} | Informational | System | All | |
Permission rule removed for {principal} on {entity.name} | Informational | System | All | |
Permission changed for {principal} on {entity.name}, role is {role.name}, propagation is {[email protected]} | Informational | System | All | |
Profile {profile.name} attached. | Informational | System | All | |
Profile {profile.name} was changed. | Informational | System | All | |
Profile is created. | Informational | System | All | |
Profile {profile.name} detached. | Informational | System | All | |
Profile {profile.name} reference host changed. | Informational | System | All | |
Profile was removed. | Informational | System | All | |
Remote Tech Support Mode (SSH) for the host {host.name} has been enabled | Informational | System | All | |
Created resource pool {resourcePool.name} in compute-resource {computeResource.name} in {datacenter.name} | Informational | System | All | |
Removed resource pool {resourcePool.name} on {computeResource.name} in {datacenter.name} | Informational | System | All | |
Moved resource pool {resourcePool.name} from {oldParent.name} to {newParent.name} on {computeResource.name} in {datacenter.name} | Informational | System | All | |
Updated configuration for {resourcePool.name} in compute-resource {computeResource.name} in {datacenter.name} | Informational | System | All | |
Resource usage exceeds configuration for resource pool {resourcePool.name} in compute-resource {computeResource.name} in {datacenter.name} | Critical | System | All | |
New role {role.name} created | Informational | System | All | |
Role {role.name} removed | Informational | System | All | |
Modifed role {role.name} | Informational | System | All | |
Task {scheduledTask.name} on {entity.name} in {datacenter.name} completed successfully | Informational | System | All | |
Created task {scheduledTask.name} on {entity.name} in {datacenter.name} | Informational | System | All | |
Task {scheduledTask.name} on {entity.name} in {datacenter.name} sent email to {to} | Informational | System | All | |
Task {scheduledTask.name} on {entity.name} in {datacenter.name} cannot send email to {to}: {reason.msg} | Critical | System | All | |
Task {scheduledTask.name} on {entity.name} in {datacenter.name} cannot be completed: {reason.msg} | Critical | System | All | |
Reconfigured task {scheduledTask.name} on {entity.name} in {datacenter.name} | Informational | System | All | |
Removed task {scheduledTask.name} on {entity.name} in {datacenter.name} | Informational | System | All | |
Running task {scheduledTask.name} on {entity.name} in {datacenter.name} | Informational | System | All | |
A vCenter Server license has expired | Critical | System | All | |
vCenter started | Informational | System | All | |
A session for user '{terminatedUsername}' has stopped | Informational | System | All | |
Task: {info.descriptionId} | Informational | System | All | |
Task: {info.descriptionId} time-out | Informational | System | All | |
Upgrading template {legacyTemplate} | Informational | System | All | |
Cannot upgrade template {legacyTemplate} due to: {reason.msg} | Informational | System | All | |
Template {legacyTemplate} upgrade completed | Informational | System | All | |
The operation performed on {host.name} in {datacenter.name} timed out | Warning | System | All | |
There are {unlicensed} unlicensed virtual machines on host {host} - there are only {available} licenses available | Informational | System | All | |
{unlicensed} unlicensed virtual machines found on host {host} | Informational | System | All | |
The agent on host {host.name} is updated and will soon restart | Informational | System | All | |
User {userLogin} was added to group {group} | Informational | System | All | |
User {userName}@{ipAddress} logged in | Informational | System | All | |
User {userName} logged out | Informational | System | All | |
Password was changed for account {userLogin} on host {host.name} | Informational | System | All | |
User {userLogin} removed from group {group} | Informational | System | All | |
{message} | Informational | System | All | |
Created VMFS datastore {datastore.name} on {host.name} in {datacenter.name} | Informational | System | All | |
Expanded VMFS datastore {datastore.name} on {host.name} in {datacenter.name} | Informational | System | All | |
Extended VMFS datastore {datastore.name} on {host.name} in {datacenter.name} | Informational | System | All | |
A vMotion license for {host.name} has expired | Critical | System | All | |
Cannot uninstall vCenter agent from {host.name} in {datacenter.name}. {[email protected]} | Critical | System | All | |
vCenter agent has been uninstalled from {host.name} in {datacenter.name} | Informational | System | All | |
Cannot upgrade vCenter agent on {host.name} in {datacenter.name}. {[email protected]} | Critical | System | All | |
vCenter agent has been upgraded on {host.name} in {datacenter.name} | Informational | System | All | |
VIM account password was changed on host {host.name} | Informational | System | All | |
Remote console to {vm.name} on {host.name} in {datacenter.name} has been opened | Informational | System | All | |
A ticket for {vm.name} of type {ticketType} on {host.name} in {datacenter.name} has been acquired | Informational | System | All | |
Invalid name for {vm.name} on {host.name} in {datacenter.name}. Renamed from {oldName} to {newName} | Informational | System | All | |
Cloning {vm.name} on host {host.name} in {datacenter.name} to {destName} on host {destHost.name} | Informational | System | All | |
Cloning {vm.name} on host {host.name} in {datacenter.name} to {destName} on host {destHost.name} | Informational | System | All | |
Creating {vm.name} on host {host.name} in {datacenter.name} | Informational | System | All | |
Deploying {vm.name} on host {host.name} in {datacenter.name} from template {srcTemplate.name} | Informational | System | All | |
Migrating {vm.name} from {host.name} to {destHost.name} in {datacenter.name} | Informational | System | All | |
Relocating {vm.name} from {host.name} to {destHost.name} in {datacenter.name} | Informational | System | All | |
Relocating {vm.name} in {datacenter.name} from {host.name} to {destHost.name} | Informational | System | All | |
Cannot clone {vm.name}: {reason.msg} | Critical | System | All | |
Clone of {sourceVm.name} completed | Informational | System | All | |
Configuration file for {vm.name} on {host.name} in {datacenter.name} cannot be found | Informational | System | All | |
Virtual machine {vm.name} is connected | Informational | System | All | |
Created virtual machine {vm.name} on {host.name} in {datacenter.name} | Informational | System | All | |
dvPort connected to VM {vm.name} on {host.name} in {datacenter.name} changed status | Informational | System | All | |
{vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name} reset by HA. Reason: {[email protected]} | Informational | System | All | |
{vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name} reset by HA. Reason: {[email protected]}. A screenshot is saved at {screenshotFilePath}. | Informational | System | All | |
Cannot reset {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name} | Warning | System | All | |
Unable to update HA agents given the state of {vm.name} | Critical | System | All | |
HA agents have been updated with the current state of the virtual machine | Informational | System | All | |
Disconnecting all hosts as the date of virtual machine {vm.name} has been rolled back | Critical | System | All | |
Cannot deploy template: {reason.msg} | Critical | System | All | |
Template {srcTemplate.name} deployed on host {host.name} | Informational | System | All | |
{vm.name} on host {host.name} in {datacenter.name} is disconnected | Informational | System | All | |
Discovered {vm.name} on {host.name} in {datacenter.name} | Informational | System | All | |
Cannot create virtual disk {disk} | Critical | System | All | |
Migrating {vm.name} off host {host.name} in {datacenter.name} | Informational | System | All | |
End a recording session on {vm.name} | Informational | System | All | |
End a replay session on {vm.name} | Informational | System | All | |
Cannot migrate {vm.name} from {host.name} to {destHost.name} in {datacenter.name} | Critical | System | All | |
Cannot complete relayout {vm.name} on {host.name} in {datacenter.name}: {reason.msg} | Critical | System | All | |
Cannot complete relayout for virtual machine {vm.name} which has disks on a VMFS2 volume. | Critical | System | All | |
vCenter cannot start the Secondary VM {vm.name}. Reason: {[email protected]} | Critical | System | All | |
Cannot power Off {vm.name} on {host.name} in {datacenter.name}: {reason.msg} | Critical | System | All | |
Cannot power On {vm.name} on {host.name} in {datacenter.name}. {reason.msg} | Critical | System | All | |
Cannot reboot the guest OS for {vm.name} on {host.name} in {datacenter.name}. {reason.msg} | Critical | System | All | |
Cannot suspend {vm.name} on {host.name} in {datacenter.name}: {reason.msg} | Critical | System | All | |
{vm.name} cannot shut down the guest OS on {host.name} in {datacenter.name}: {reason.msg} | Critical | System | All | |
{vm.name} cannot standby the guest OS on {host.name} in {datacenter.name}: {reason.msg} | Critical | System | All | |
Cannot suspend {vm.name} on {host.name} in {datacenter.name}: {reason.msg} | Critical | System | All | |
vCenter cannot update the Secondary VM {vm.name} configuration | Critical | System | All | |
Failover unsuccessful for {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name}. Reason: {reason.msg} | Warning | System | All | |
Fault Tolerance state on {vm.name} changed from {[email protected]} to {[email protected]} | Informational | System | All | |
Fault Tolerance protection has been turned off for {vm.name} | Informational | System | All | |
The Fault Tolerance VM ({vm.name}) has been terminated. {[email protected]} | Informational | System | All | |
Guest OS reboot for {vm.name} on {host.name} in {datacenter.name} | Informational | System | All | |
Guest OS shut down for {vm.name} on {host.name} in {datacenter.name} | Informational | System | All | |
Guest OS standby for {vm.name} on {host.name} in {datacenter.name} | Informational | System | All | |
VM monitoring state in {computeResource.name} in {datacenter.name} changed to {[email protected]} | Informational | System | All | |
Assign a new instance UUID ({instanceUuid}) to {vm.name} | Informational | System | All | |
The instance UUID of {vm.name} has been changed from ({oldInstanceUuid}) to ({newInstanceUuid}) | Informational | System | All | |
The instance UUID ({instanceUuid}) of {vm.name} conflicts with the instance UUID assigned to {conflictedVm.name} | Critical | System | All | |
New MAC address ({mac}) assigned to adapter {adapter} for {vm.name} | Informational | System | All | |
Changed MAC address from {oldMac} to {newMac} for adapter {adapter} for {vm.name} | Warning | System | All | |
The MAC address ({mac}) of {vm.name} conflicts with MAC assigned to {conflictedVm.name} | Critical | System | All | |
Reached maximum Secondary VM (with FT turned On) restart count for {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name}. | Warning | System | All | |
Reached maximum VM restart count for {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name}. | Warning | System | All | |
Error message on {vm.name} on {host.name} in {datacenter.name}: {message} | Critical | System | All | |
Message on {vm.name} on {host.name} in {datacenter.name}: {message} | Informational | System | All | |
Warning message on {vm.name} on {host.name} in {datacenter.name}: {message} | Warning | System | All | |
Migration of virtual machine {vm.name} from {sourceHost.name} to {host.name} completed | Informational | System | All | |
No compatible host for the Secondary VM {vm.name} | Critical | System | All | |
Not all networks for {vm.name} are accessible by {destHost.name} | Warning | System | All | |
{vm.name} does not exist on {host.name} in {datacenter.name} | Warning | System | All | |
{vm.name} was powered Off on the isolated host {isolatedHost.name} in cluster {computeResource.name} in {datacenter.name} | Informational | System | All | |
{vm.name} on {host.name} in {datacenter.name} is powered off | Informational | System | All | |
{vm.name} on {host.name} in {datacenter.name} is powered on | Informational | System | All | |
Virtual machine {vm.name} powered On with vNICs connected to dvPorts that have a port level configuration, which might be different from the dvPort group configuration. | Informational | System | All | |
VM ({vm.name}) failed over to {host.name}. {[email protected]} | Critical | System | All | |
Reconfigured {vm.name} on {host.name} in {datacenter.name} | Informational | System | All | |
Registered {vm.name} on {host.name} in {datacenter.name} | Informational | System | All | |
Relayout of {vm.name} on {host.name} in {datacenter.name} completed | Informational | System | All | |
{vm.name} on {host.name} in {datacenter.name} is in the correct format and relayout is not necessary | Informational | System | All | |
{vm.name} on {host.name} reloaded from new configuration {configPath}. | Informational | System | All | |
{vm.name} on {host.name} could not be reloaded from {configPath}. | Critical | System | All | |
Cannot relocate virtual machine '{vm.name}' in {datacenter.name} | Critical | System | All | |
Completed the relocation of the virtual machine | Informational | System | All | |
Remote console connected to {vm.name} on host {host.name} | Informational | System | All | |
Remote console disconnected from {vm.name} on host {host.name} | Informational | System | All | |
Removed {vm.name} on {host.name} from {datacenter.name} | Informational | System | All | |
Renamed {vm.name} from {oldName} to {newName} in {datacenter.name} | Warning | System | All | |
{vm.name} on {host.name} in {datacenter.name} is reset | Informational | System | All | |
Moved {vm.name} from resource pool {oldParent.name} to {newParent.name} in {datacenter.name} | Informational | System | All | |
Changed resource allocation for {vm.name} | Informational | System | All | |
Virtual machine {vm.name} was restarted on {host.name} since {sourceHost.name} failed | Informational | System | All | |
{vm.name} on {host.name} in {datacenter.name} is resumed | Informational | System | All | |
A Secondary VM has been added for {vm.name} | Informational | System | All | |
vCenter disabled Fault Tolerance on VM '{vm.name}' because the Secondary VM could not be powered On. | Critical | System | All | |
Disabled Secondary VM for {vm.name} | Informational | System | All | |
Enabled Secondary VM for {vm.name} | Informational | System | All | |
Started Secondary VM for {vm.name} | Informational | System | All | |
{vm.name} was shut down on the isolated host {isolatedHost.name} in cluster {computeResource.name} in {datacenter.name}: {[email protected]} | Informational | System | All | |
Start a recording session on {vm.name} | Informational | System | All | |
Start a replay session on {vm.name} | Informational | System | All | |
{vm.name} on host {host.name} in {datacenter.name} is starting | Informational | System | All | |
Starting Secondary VM for {vm.name} | Informational | System | All | |
The static MAC address ({mac}) of {vm.name} conflicts with MAC assigned to {conflictedVm.name} | Critical | System | All | |
{vm.name} on {host.name} in {datacenter.name} is stopping | Informational | System | All | |
{vm.name} on {host.name} in {datacenter.name} is suspended | Informational | System | All | |
{vm.name} on {host.name} in {datacenter.name} is being suspended | Informational | System | All | |
Starting the Secondary VM {vm.name} timed out within {timeout} ms | Critical | System | All | |
Unsupported guest OS {guestId} for {vm.name} on {host.name} in {datacenter.name} | Warning | System | All | |
Virtual hardware upgraded to version {version} | Informational | System | All | |
Cannot upgrade virtual hardware | Critical | System | All | |
Upgrading virtual hardware on {vm.name} in {datacenter.name} to version {version} | Informational | System | All | |
Assigned new BIOS UUID ({uuid}) to {vm.name} on {host.name} in {datacenter.name} | Informational | System | All | |
Changed BIOS UUID from {oldUuid} to {newUuid} for {vm.name} on {host.name} in {datacenter.name} | Warning | System | All | |
BIOS ID ({uuid}) of {vm.name} conflicts with that of {conflictedVm.name} | Critical | System | All | |
New WWNs assigned to {vm.name} | Informational | System | All | |
WWNs are changed for {vm.name} | Warning | System | All | |
The WWN ({wwn}) of {vm.name} conflicts with the currently registered WWN | Critical | System | All | |
{message} | Warning | System | All | |
Booting from iSCSI failed with an error. See the VMware Knowledge Base for information on configuring iBFT networking. | Warning | System | All | |
com.vmware.license.AddLicenseEvent | License {licenseKey} added to VirtualCenter | Informational | System | All |
com.vmware.license.AssignLicenseEvent | License {licenseKey} assigned to asset {entityName} with id {entityId} | Informational | System | All |
com.vmware.license.DLFDownloadFailedEvent | Failed to download license information from the host {hostname} due to {errorReason.@enum.com.vmware.license.DLFDownloadFailedEvent.DLFDownloadFailedReason} | Warning | System | All |
com.vmware.license.LicenseAssignFailedEvent | License assignment on the host fails. Reasons: {[email protected]}. | Informational | System | All |
com.vmware.license.LicenseExpiryEvent | Your host license will expire in {remainingDays} days. The host will be disconnected from VC when its license expires. | Warning | System | All |
com.vmware.license.LicenseUserThresholdExceededEvent | Current license usage ({currentUsage} {costUnitText}) for {edition} exceeded the user-defined threshold ({threshold} {costUnitText}) | Warning | System | All |
com.vmware.license.RemoveLicenseEvent | License {licenseKey} removed from VirtualCenter | Informational | System | All |
com.vmware.license.UnassignLicenseEvent | License unassigned from asset {entityName} with id {entityId} | Informational | System | All |
com.vmware.vc.HA.ClusterFailoverActionCompletedEvent | HA completed a failover action in cluster {computeResource.name} in datacenter {datacenter.name} | Informational | System | All |
com.vmware.vc.HA.ClusterFailoverActionInitiatedEvent | HA initiated a failover action in cluster {computeResource.name} in datacenter {datacenter.name} | Warning | System | All |
com.vmware.vc.HA.DasAgentRunningEvent | HA Agent on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} is running | Informational | System | All |
com.vmware.vc.HA.DasFailoverHostFailedEvent | HA failover host {host.name} in cluster {computeResource.name} in {datacenter.name} has failed | Critical | System | All |
com.vmware.vc.HA.DasHostCompleteDatastoreFailureEvent | All shared datastores failed on the host {hostName} in cluster {computeResource.name} in {datacenter.name} | Critical | System | All |
com.vmware.vc.HA.DasHostCompleteNetworkFailureEvent | All VM networks failed on the host {hostName} in cluster {computeResource.name} in {datacenter.name} | Critical | System | All |
com.vmware.vc.HA.DasHostFailedEvent | A possible host failure has been detected by HA on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} | Critical | System | All |
com.vmware.vc.HA.DasHostMonitoringDisabledEvent | No virtual machine failover will occur until Host Monitoring is enabled in cluster {computeResource.name} in {datacenter.name} | Warning | System | All |
com.vmware.vc.HA.DasTotalClusterFailureEvent | HA recovered from a total cluster failure in cluster {computeResource.name} in datacenter {datacenter.name} | Warning | System | All |
com.vmware.vc.HA.HostDasAgentHealthyEvent | HA Agent on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} is healthy | Informational | System | All |
com.vmware.vc.HA.HostDasErrorEvent | HA agent on {host.name} in cluster {computeResource.name} in {datacenter.name} has an error: {[email protected]} | Critical | System | All |
com.vmware.vc.VCHealthStateChangedEvent | vCenter Service overall health changed from '{oldState}' to '{newState}' | Informational | System | All |
com.vmware.vc.cim.CIMGroupHealthStateChanged | Health of [data.group] changed from [data.oldState] to [data.newState]. | Informational | System | All |
com.vmware.vc.datastore.UpdateVmFilesFailedEvent | Failed to update VM files on datastore {ds.name} using host {hostName} | Critical | System | All |
com.vmware.vc.datastore.UpdatedVmFilesEvent | Updated VM files on datastore {ds.name} using host {hostName} | Informational | System | All |
com.vmware.vc.datastore.UpdatingVmFilesEvent | Updating VM files on datastore {ds.name} using host {hostName} | Informational | System | All |
com.vmware.vc.ft.VmAffectedByDasDisabledEvent | VMware HA has been disabled in cluster {computeResource.name} of datacenter {datacenter.name}. HA will not restart VM {vm.name} or its Secondary VM after a failure. | Warning | System | All |
com.vmware.vc.npt.VmAdapterEnteredPassthroughEvent | Network passthrough is active on adapter {deviceLabel} of virtual machine {vm.name} on host {host.name} in {datacenter.name} | Informational | System | All |
com.vmware.vc.npt.VmAdapterExitedPassthroughEvent | Network passthrough is inactive on adapter {deviceLabel} of virtual machine {vm.name} on host {host.name} in {datacenter.name} | Informational | System | All |
com.vmware.vc.vcp.FtDisabledVmTreatAsNonFtEvent | HA VM Component Protection protects virtual machine {vm.name} on {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} as non-FT virtual machine because the FT state is disabled | Informational | System | All |
com.vmware.vc.vcp.FtFailoverEvent | FT Primary VM {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} is going to fail over to Secondary VM due to component failure | Informational | System | All |
com.vmware.vc.vcp.FtFailoverFailedEvent | FT virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} failed to failover to secondary | Critical | System | All |
com.vmware.vc.vcp.FtSecondaryRestartEvent | HA VM Component Protection is restarting FT secondary virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} due to component failure | Informational | System | All |
com.vmware.vc.vcp.FtSecondaryRestartFailedEvent | FT Secondary VM {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} failed to restart | Critical | System | All |
com.vmware.vc.vcp.NeedSecondaryFtVmTreatAsNonFtEvent | HA VM Component Protection protects virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} as non-FT virtual machine because it has been in the needSecondary state too long | Informational | System | All |
com.vmware.vc.vcp.TestEndEvent | VM Component Protection test ends on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} | Informational | System | All |
com.vmware.vc.vcp.TestStartEvent | VM Component Protection test starts on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} | Informational | System | All |
com.vmware.vc.vcp.VcpNoActionEvent | HA VM Component Protection did not take action on virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} due to the feature configuration setting | Informational | System | All |
com.vmware.vc.vcp.VmDatastoreFailedEvent | Virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} lost access to {datastore} | Critical | System | All |
com.vmware.vc.vcp.VmNetworkFailedEvent | Virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} lost access to {network} | Critical | System | All |
com.vmware.vc.vcp.VmPowerOffHangEvent | HA VM Component Protection could not power off virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} successfully after trying {numTimes} times and will keep trying | Critical | System | All |
com.vmware.vc.vcp.VmRestartEvent | HA VM Component Protection is restarting virtual machine {vm.name} due to component failure on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} | Informational | System | All |
com.vmware.vc.vcp.VmRestartFailedEvent | Virtual machine {vm.name} affected by component failure on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} failed to restart | Critical | System | All |
com.vmware.vc.vcp.VmWaitForCandidateHostEvent | HA VM Component Protection could not find a destination host for virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} after waiting {numSecWait} seconds and will keep trying | Critical | System | All |
com.vmware.vc.vmam.AppMonitoringNotSupported | Application monitoring is not supported on {host.name} in cluster {computeResource.name} in {datacenter.name} | Warning | System | All |
com.vmware.vc.vmam.VmAppHealthMonitoringStateChangedEvent | Application heartbeat status changed to {status} for {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name} | Warning | System | All |
com.vmware.vc.vmam.VmDasAppHeartbeatFailedEvent | Application heartbeat failed for {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name} | Warning | System | All |
esx.clear.net.connectivity.restored | Network connectivity restored on virtual switch {1}, portgroups: {2}. Physical NIC {3} is up. | Informational | System | All |
esx.clear.net.dvport.connectivity.restored | Network connectivity restored on DVPorts: {1}. Physical NIC {2} is up. | Informational | System | All |
esx.clear.net.dvport.redundancy.restored | Uplink redundancy restored on DVPorts: {1}. Physical NIC {2} is up. | Informational | System | All |
esx.clear.net.redundancy.restored | Uplink redundancy restored on virtual switch {1}, portgroups: {2}. Physical NIC {3} is up. | Informational | System | All |
esx.clear.net.vmnic.linkstate.up | Physical NIC {1} linkstate is up. | Informational | System | All |
esx.clear.storage.connectivity.restored | Connectivity to storage device {1} (Datastores: {2}) restored. Path {3} is active again. | Informational | System | All |
esx.clear.storage.redundancy.restored | Path redundancy to storage device {1} (Datastores: {2}) restored. Path {3} is active again. | Informational | System | All |
esx.problem.apei.bert.memory.error.corrected | A corrected memory error occurred in last boot. The following details were reported. Physical Addr: {1}, Physical Addr Mask: {2}, Node: {3}, Card: {4}, Module: {5}, Bank: {6}, Device: {7}, Row: {8}, Column: {9} Error type: {10} | Critical | System | All |
esx.problem.apei.bert.memory.error.fatal | A fatal memory error occurred in the last boot. The following details were reported. Physical Addr: {1}, Physical Addr Mask: {2}, Node: {3}, Card: {4}, Module: {5}, Bank: {6}, Device: {7}, Row: {8}, Column: {9} Error type: {10} | Critical | System | All |
esx.problem.apei.bert.memory.error.recoverable | A recoverable memory error occurred in last boot. The following details were reported. Physical Addr: {1}, Physical Addr Mask: {2}, Node: {3}, Card: {4}, Module: {5}, Bank: {6}, Device: {7}, Row: {8}, Column: {9} Error type: {10} | Critical | System | All |
esx.problem.apei.bert.pcie.error.corrected | A corrected PCIe error occurred in last boot. The following details were reported. Port Type: {1}, Device: {2}, Bus #: {3}, Function: {4}, Slot: {5}, Device Vendor: {6}, Version: {7}, Command Register: {8}, Status Register: {9}. | Critical | System | All |
esx.problem.apei.bert.pcie.error.fatal | Platform encounterd a fatal PCIe error in last boot. The following details were reported. Port Type: {1}, Device: {2}, Bus #: {3}, Function: {4}, Slot: {5}, Device Vendor: {6}, Version: {7}, Command Register: {8}, Status Register: {9}. | Critical | System | All |
esx.problem.apei.bert.pcie.error.recoverable | A recoverable PCIe error occurred in last boot. The following details were reported. Port Type: {1}, Device: {2}, Bus #: {3}, Function: {4}, Slot: {5}, Device Vendor: {6}, Version: {7}, Command Register: {8}, Status Register: {9}. | Critical | System | All |
esx.problem.iorm.nonviworkload | An external I/O activity is detected on datastore {1}, this is an unsupported configuration. Consult the Resource Management Guide or follow the Ask VMware link for more information. | Informational | System | All |
esx.problem.net.connectivity.lost | Lost network connectivity on virtual switch {1}. Physical NIC {2} is down. Affected portgroups:{3}. | Critical | System | All |
esx.problem.net.dvport.connectivity.lost | Lost network connectivity on DVPorts: {1}. Physical NIC {2} is down. | Critical | System | All |
esx.problem.net.dvport.redundancy.degraded | Uplink redundancy degraded on DVPorts: {1}. Physical NIC {2} is down. | Warning | System | All |
esx.problem.net.dvport.redundancy.lost | Lost uplink redundancy on DVPorts: {1}. Physical NIC {2} is down. | Warning | System | All |
esx.problem.net.e1000.tso6.notsupported | Guest-initiated IPv6 TCP Segmentation Offload (TSO) packets ignored. Manually disable TSO inside the guest operating system in virtual machine {1}, or use a different virtual adapter. | Critical | System | All |
esx.problem.net.migrate.bindtovmk | The ESX advanced configuration option /Migrate/Vmknic is set to an invalid vmknic: {1}. /Migrate/Vmknic specifies a vmknic that vMotion binds to for improved performance. Update the configuration option with a valid vmknic. Alternatively, if you do not want vMotion to bind to a specific vmknic, remove the invalid vmknic and leave the option blank. | Warning | System | All |
esx.problem.net.proxyswitch.port.unavailable | Virtual NIC with hardware address {1} failed to connect to distributed virtual port {2} on switch {3}. There are no more ports available on the host proxy switch. | Warning | System | All |
esx.problem.net.redundancy.degraded | Uplink redundancy degraded on virtual switch {1}. Physical NIC {2} is down. Affected portgroups:{3}. | Warning | System | All |
esx.problem.net.redundancy.lost | Lost uplink redundancy on virtual switch {1}. Physical NIC {2} is down. Affected portgroups:{3}. | Warning | System | All |
esx.problem.net.uplink.mtu.failed | VMkernel failed to set the MTU value {1} on the uplink {2}. | Warning | System | All |
esx.problem.net.vmknic.ip.duplicate | A duplicate IP address was detected for {1} on the interface {2}. The current owner is {3}. | Warning | System | All |
esx.problem.net.vmnic.linkstate.down | Physical NIC {1} linkstate is down. | Informational | System | All |
esx.problem.net.vmnic.watchdog.reset | Uplink {1} has recovered from a transient failure due to watchdog timeout | Informational | System | All |
esx.problem.scsi.device.limitreached | The maximum number of supported devices of {1} has been reached. A device from plugin {2} could not be created. | Critical | System | All |
esx.problem.scsi.device.thinprov.atquota | Space utilization on thin-provisioned device {1} exceeded configured threshold. Affected datastores (if any): {2}. | Warning | System | All |
esx.problem.scsi.scsipath.limitreached | The maximum number of supported paths of {1} has been reached. Path {2} could not be added. | Critical | System | All |
esx.problem.storage.connectivity.devicepor | Frequent PowerOn Reset Unit Attentions are occurring on device {1}. This might indicate a storage problem. Affected datastores: {2} | Warning | System | All |
esx.problem.storage.connectivity.lost | Lost connectivity to storage device {1}. Path {2} is down. Affected datastores: {3}. | Critical | System | All |
esx.problem.storage.connectivity.pathpor | Frequent PowerOn Reset Unit Attentions are occurring on path {1}. This might indicate a storage problem. Affected device: {2}. Affected datastores: {3} | Warning | System | All |
esx.problem.storage.connectivity.pathstatechanges | Frequent path state changes are occurring for path {1}. This might indicate a storage problem. Affected device: {2}. Affected datastores: {3} | Warning | System | All |
esx.problem.storage.redundancy.degraded | Path redundancy to storage device {1} degraded. Path {2} is down. Affected datastores: {3}. | Warning | System | All |
esx.problem.storage.redundancy.lost | Lost path redundancy to storage device {1}. Path {2} is down. Affected datastores: {3}. | Warning | System | All |
esx.problem.vmfs.heartbeat.recovered | Successfully restored access to volume {1} ({2}) following connectivity issues. | Informational | System | All |
esx.problem.vmfs.heartbeat.timedout | Lost access to volume {1} ({2}) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly. | Informational | System | All |
esx.problem.vmfs.heartbeat.unrecoverable | Lost connectivity to volume {1} ({2}) and subsequent recovery attempts have failed. | Critical | System | All |
esx.problem.vmfs.journal.createfailed | No space for journal on volume {1} ({2}). Opening volume in read-only metadata mode with limited write support. | Critical | System | All |
esx.problem.vmfs.lock.corruptondisk | At least one corrupt on-disk lock was detected on volume {1} ({2}). Other regions of the volume might be damaged too. | Critical | System | All |
esx.problem.vmfs.nfs.mount.connect.failed | Failed to mount to the server {1} mount point {2}. {3} | Critical | System | All |
esx.problem.vmfs.nfs.mount.limit.exceeded | Failed to mount to the server {1} mount point {2}. {3} | Critical | System | All |
esx.problem.vmfs.nfs.server.disconnect | Lost connection to server {1} mount point {2} mounted as {3} ({4}). | Critical | System | All |
esx.problem.vmfs.nfs.server.restored | Restored connection to server {1} mount point {2} mounted as {3} ({4}). | Informational | System | All |
esx.problem.vmfs.resource.corruptondisk | At least one corrupt resource metadata region was detected on volume {1} ({2}). Other regions of the volume might be damaged too. | Critical | System | All |
esx.problem.vmfs.volume.locked | Volume on device {1} locked, possibly because remote host {2} encountered an error during a volume operation and could not recover. | Critical | System | All |
vim.event.LicenseDowngradedEvent | License downgrade: {licenseKey} removes the following features: {lostFeatures} | Warning | System | All |
vprob.net.connectivity.lost | Lost network connectivity on virtual switch {1}. Physical NIC {2} is down. Affected portgroups:{3}. | Critical | System | All |
vprob.net.e1000.tso6.notsupported | Guest-initiated IPv6 TCP Segmentation Offload (TSO) packets ignored. Manually disable TSO inside the guest operating system in virtual machine {1}, or use a different virtual adapter. | Critical | System | All |
vprob.net.migrate.bindtovmk | The ESX advanced config option /Migrate/Vmknic is set to an invalid vmknic: {1}. /Migrate/Vmknic specifies a vmknic that vMotion binds to for improved performance. Please update the config option with a valid vmknic or, if you do not want vMotion to bind to a specific vmknic, remove the invalid vmknic and leave the option blank. | Warning | System | All |
vprob.net.proxyswitch.port.unavailable | Virtual NIC with hardware address {1} failed to connect to distributed virtual port {2} on switch {3}. There are no more ports available on the host proxy switch. | Warning | System | All |
vprob.net.redundancy.degraded | Uplink redundancy degraded on virtual switch {1}. Physical NIC {2} is down. {3} uplinks still up. Affected portgroups:{4}. | Warning | System | All |
vprob.net.redundancy.lost | Lost uplink redundancy on virtual switch {1}. Physical NIC {2} is down. Affected portgroups:{3}. | Warning | System | All |
vprob.scsi.device.thinprov.atquota | Space utilization on thin-provisioned device {1} exceeded configured threshold. | Warning | System | All |
vprob.storage.connectivity.lost | Lost connectivity to storage device {1}. Path {2} is down. Affected datastores: {3}. | Critical | System | All |
vprob.storage.redundancy.degraded | Path redundancy to storage device {1} degraded. Path {2} is down. {3} remaining active paths. Affected datastores: {4}. | Warning | System | All |
vprob.storage.redundancy.lost | Lost path redundancy to storage device {1}. Path {2} is down. Affected datastores: {3}. | Warning | System | All |
vprob.vmfs.heartbeat.recovered | Successfully restored access to volume {1} ({2}) following connectivity issues. | Informational | System | All |
vprob.vmfs.heartbeat.timedout | Lost access to volume {1} ({2}) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly. | Informational | System | All |
vprob.vmfs.heartbeat.unrecoverable | Lost connectivity to volume {1} ({2}) and subsequent recovery attempts have failed. | Critical | System | All |
vprob.vmfs.journal.createfailed | No space for journal on volume {1} ({2}). Opening volume in read-only metadata mode with limited write support. | Critical | System | All |
vprob.vmfs.lock.corruptondisk | At least one corrupt on-disk lock was detected on volume {1} ({2}). Other regions of the volume may be damaged too. | Critical | System | All |
vprob.vmfs.nfs.server.disconnect | Lost connection to server {1} mount point {2} mounted as {3} ({4}). | Critical | System | All |
vprob.vmfs.nfs.server.restored | Restored connection to server {1} mount point {2} mounted as {3} ({4}). | Informational | System | All |
vprob.vmfs.resource.corruptondisk | At least one corrupt resource metadata region was detected on volume {1} ({2}). Other regions of the volume might be damaged too. | Critical | System | All |
vprob.vmfs.volume.locked | Volume on device {1} locked, possibly because remote host {2} encountered an error during a volume operation and could not recover. | Critical | System | All |
RHEV
Red Hat® Enterprise Virtualization (RHEV) является одной из наиболее широко применяемых технологий компаниями, использующими операционную систему Red Hat в качестве основы в своем Центре обработки данных. Pandora FMS Enterprise предлагает возможность мониторинга виртуальных архитектур на базе RHEV с помощью RHEV Monitoring Plugin, который позволяет легко контролировать все аспекты, связанные с виртуальной архитектурой RHEV.
Архитектура для мониторинга
С помощью плагина можно контролировать всю архитектуру системы RHEV: центры обработки данных, кластеры хостов, домены хранения данных, сети, хосты и виртуальные машины, предлагая общий взгляд на состояние виртуальной среды.
Для этого Pandora FMS использует официальный API, предоставляемый системой виртуализации RHEV.
Мониторинг с помощью RHEV Monitoring Plugin
Мониторинг виртуальной среды RHEV основан на двух компонентах:
- На Плагине Агента, выполняющем задачи автообнаружения и сбора данных. Плагин Агента отвечает за отправление информации в Pandora FMS.
- На скрипте распознавания, который обновляет различные значения для обнаруженных объектов. Это руководство необходимо для правильного функционирования расширений плагина.
- Расширение RHEV Viewer и RHEV Manager. Это расширения, которые обеспечивают дополнительную ценность, позволяя видеть контролируемую инфраструктуру и управлять выключением/включением большего количества виртуальных машин, и все это с веб-консоли Pandora FMS.
Для использования скрипта распознавания вам необходимо активировать Reconserver
Чтобы некоторые переменные API отражали реальное значение соответствующей виртуальной машины, вам необходимо установить Агент RHEV; вы можете найти все об этом в документации к вашей версии RHEV.
Для мониторинга установленной операционной системы на виртуальных машинах рекомендуется использовать Агента Pandora FMS вместо RHEV API.
Внутренняя работа плагина
Плагин RHEV Monitoring Plugin извлекает информацию через API web, обслуживающий среду виртуализации RHEV.
Если вам нужна только информация о мониторинге, все, что вам нужно настроить, это плагин Агента, который выполняет эту задачу.
Плагин Агента выполняет обнаружение устройств и составляет XML с модулями для каждого из них. Конфигурация плагина позволяет выбрать, какие элементы будут контролироваться, и конфигурацию его модулей. Модули, созданные плагином, являются настраиваемыми, и можно изменить название и описание, а также добавить максимальные и минимальные значения для состояний модуля Warning
и Critical
.
После создания XML, плагин Агента, отправляет файлы, используя либо Tentacle или копируя их в локальный каталог, в зависимости от выбранного метода передачи.
Если вы также собираетесь использовать расширения RHEV Viewer и RHEV Manager, вам необходимо использовать распознавание script.
Руководство по распознаванию отвечает за обновление некоторых переменных для каждого из Агентов, обнаруженных в Pandora FMS, в соответствии со значениями, настроенными в RHEV. Эти переменные необходимы для правильного отображения объектов в расширении RHEV Viewer и для правильного управления виртуальными машинами с помощью расширения RHEV Manager.
Необходимые условия установки
Плагин Агента требует установки следующего программное обеспечение:
- curl.
- perl-XML-Simple.
- Программный АгентPandora FMS.
- tentacle_client (если вы хотите использовать tentacle для отправки файлов, tentacle_client устанавливается вместе с Программным Агентом Pandora FMS).
Red Hat
В системах на базе Red Hat® можно установить зависимости с помощью команды:
yum install perl-XML-Simple curl
SLES
На системах на базе SUSE вы можете установить зависимости с помощью команды:
zypper install perl-XML-Simple curl
Debian/Ubuntu
В системах на базе Debiand/Ubuntu вы можете установить зависимости с помощью команды:
apt-get install libxml-simple-perl curl
Установка программного агента Pandora FMS
Установка программного агента Pandora FMS объясняется в следующем разделе Установка Pandora FMS, здесь вы найдете все необходимое для установки данного Агента на вашу платформу.
Скачать сертификат RHEV
Перед использованием плагина необходимо загрузить сертификат, позволяющий HTTPS-соединение с API RHEV. Для этого выполните следующую команду:
curl -o rhevm.cer http://[RHEVM-HOST]:8080/ca.crt
Где [rhevm-host]
- имя сервера, обслуживающего API RHEV. Конкретным примером может быть:
curl -o rhevm.cer http://rhevm.server:8080/ca.crt
После загрузки сертификата вы можете проверить правильность подключения к API с помощью следующей команды, используя соединители строк >
curl -X GET \ -H "Accept: application/xml" \ -u [USER:PASS] \ --cacert [CERT] https://[RHEVM-HOST]:8443/api
Со следующими значениями:
- USER: user@domain для подключения к API.
- PASS: пароль пользователя, с которым вы подключаетесь к API.
- CERT: путь к сертификату, загруженному в предыдущем шаге.
- RHEVM-HOST: адрес хоста, обслуживающего API.
Пример с конкретными данными команды будет выглядеть следующим образом:
curl -X GET \ -H "Accept: application/xml" \ -u [user@testdomain:12345] \ --cacert /home/user/ca.crt https://rhevm.server:8443/api
Если команда выполнена положительно, она возвращает вывод в формате XML с общей информацией об API RHEV.
Предварительные замечания по конфигурации RHEV
В среде виртуализации RHEV возможно, чтобы несколько объектов имели одинаковое имя. Это является проблемой, поскольку в Pandora FMS эти объекты преобразуются в Агентов, в которых дублирование в именах не допускается. Кроме того, из-за этого также возникают проблемы при анализировании результата, возвращаемого API в формате XML, выдается ошибка, подобная следующей:
Warning: <data_center> element has non-unique value in 'name' key attribute: Default at ./plugin-rhev.pl line 199
Для решения проблемы необходимо лишь следовать номенклатуре имен для объектов среды виртуализации RHEV, в которой имена не повторяются.
Установка плагина агента
Для установки плагина Агента достаточно скопировать скрипт rhev-plugin.pl
и файл конфигурации rhev-plugin.conf
в каталог устройства, на котором установлен Pandora FMS Agent, выполняющий плагин. Плагин может быть запущен в Агенте, установленном на тех же устройствах, что и сервер Pandora FMS, или на другом устройстве.
Для запуска плагина необходимо добавить в конфигурационный файл Агента (по умолчанию /etc/pandora/pandora_agent.conf
) следующая строка:
module_plugin /root/rhev-plugin.pl /root/rhev-plugin.conf
При добавлении этой строки, плагин Агента будет выполнять свои функции при каждом выполнении.
Мониторинг виртуальной архитектуры RHEV
Чтобы увидеть результат выполнения плагина Агента, перейдите в Monitoring → Views → Agent Detail.
Плагин создает Агента в Pandora FMS для каждого из объектов, найденных при обнаружении архитектуры RHEV./p>
Щелкнув на имени Агента, вы сможете увидеть модули мониторинга, созданные плагином, а также другие связанные с ним данные:
Для каждого типа объекта автоматически создается серия специальных модулей, отслеживающих важную информацию о каждом из них.
Если выбранный агент соответствует хосту, а не виртуальной машине, модули мониторинга будут отличаться.
Плагин RHEV также отслеживает события внутри виртуальной архитектуры. Плагин создаст один модуль для каждого события, над которым осуществляется мониторинг, в каждом затронутом объекте:
Данные для модулей, созданных на основе событий, - это данные о событии: время события, описание события. Пример данных:
Помимо Агентов и Модулей, относящихся к самой архитектуре RHEV, в Агенте генерируется модуль, выполняющий плагин. По умолчанию этот модуль называется RHEV Plugin:
Содержимое модуля будет результатом выполнения плагина; оно может быть OK, если все правильно, или показывать строку ошибки с объяснением ошибки, если происходит что-то непредвиденное. Эта информация в дополнение к модулю плагина может быть просмотрена в файле log.
Мониторинг состояния организаций
Модули состояния различных объектов возвращают значения, предопределенные в архитектуре RHEV. Это означает, что значения будут строками, содержание которых будет up
, down
, error
, maintenance
, non_operational
и т.д., в зависимости от статуса и контролируемого объекта.
Для присвоения значений warning
и critical
необходимо определить регулярное выражение в конфигурации модуля. Например, чтобы задать критическое состояние Модуля, которое определяется значениями error, down и non_operational, мы вставляем в поле Str. критического значения модуля следующее регулярное выражение:
error|down|non_operational
Модули агента виртуальной архитектуры RHEV
Ниже перечислены модули, доступные для каждого элемента архитектуры RHEV.
Data Center
- Status: Состояние центра обработки данных.
Storage Domain
- Available Space: Доступное пространство в Storage Domain.
- Committed Space: Принятое пространство в Storage Domain.
- Used Space: Пространство, использованное в Storage Domain.
- Percent Free Space: Процент свободного пространства в Storage Domain.
Network
- Status: Состояние виртуальной сети.
- STP Status: Состояние функциональности протокола Spanning Tree Protocol.
Кластер
- Overcommit Percent: Процент от чрезмерной нагрузки на кластер.
- Transparent HugePages: Состояние функциональности Transparent HugePages.
- High threshold: Верхний предел политики планирования.
- Low threshold: Нижний предел политики планирования.
- Threshold duration: Срок действия ограничений в политике планирования.
Host
- Status: Статус Хоста.
- Buffers size: Размер буферов.
- Cache size: Размер кэша.
- Cached swap: Объем кэширования памяти Swap (в байтах).
- Free memory: Объем свободной памяти (в байтах).
- Percent free memory: Процент свободной памяти.
- Swap cached percent: Процент кэширования памяти Swap.
- Swap free: Объем свободной памяти Swap (в байтах).
- Swap free percent: Процент свободной памяти Swap.
- Total Memory: Общий объем памяти Хоста (в байтах).
- Total Swap: Общий объем памяти Swap (в байтах).
- Used memory: Общий объем используемой памяти (в байтах).
- Used Swap: Общий объем используемой памяти Swap (в байтах).
- Nic [x] TX: Скорость передачи данных сетевого интерфейса [x] (в байтах/секунду). Генерируется для каждого обнаруженного сетевого интерфейса.
- Nic [x] RX: Скорость приема сетевого интерфейса [x] (в байтах/секунду). Генерируется для каждого обнаруженного сетевого интерфейса.
- Nic [x] erros TX: Количество ошибок передачи сетевого интерфейса [x]. Генерируется для каждого обнаруженного сетевого интерфейса.
- Nic [x] erros RX: Количество ошибок приема сетевого интерфейса [x]. Генерируется для каждого обнаруженного сетевого интерфейса.
- User CPU: Процент процессора, используемого пользователем.
- System CPU: Процент процессора, используемого системой.
- CPU Idle: Процент простоя процессора.
- CPU Load: Средняя загрузка процессора за последние 5 минут.
- KSM CPU: Процент процессора, используемого KSM.
- Active VM: Количество активных виртуальных машин в Хосте.
- Migrating VM: Количество виртуальных машин в миграции в Хосте.
- Total VM: Общее количество виртуальных машин Хоста.
- Fence Status: Статус hostfencing.
Virtual Machine
- Status: Состояние виртуальной машины.
- Disk [x] read: Скорость чтения с диска x (байт/с). Один генерируется для каждого обнаруженного диска (хранилища).
- Disk [x] write: Скорость записи на диск x (байт/с). Генерируется для каждого обнаруженного диска.
- Disk [x] size: Размер диска x (в байтах). Генерируется для каждого обнаруженного диска.
- Disk [x] status: Статус Диска x. Генерируется для каждого обнаруженного диска.
- Nic [x] TX: Скорость передачи данных сетевого интерфейса [x] (в байтах/секунду). Генерируется для каждого обнаруженного сетевого интерфейса.
- Nic [x] RX: Скорость приема для сетевого интерфейса [x] (в байтах/секунду). Генерируется для каждого обнаруженного сетевого интерфейса.
- Nic [x] erros TX: Количество ошибок передачи сетевого интерфейса [x]. Генерируется для каждого обнаруженного сетевого интерфейса.
- Nic [x] erros RX: Количество ошибок приема сетевого интерфейса [x]. Генерируется для каждого обнаруженного сетевого интерфейса.
- Installed memory: Объем установленной памяти (в байтах).
- Percent free memory: Процент свободной памяти.
- Used memory: Объем используемой памяти (в байтах).
- Stateless: Состояние функционирования Stateless.
- HA Status: Состояние функционирования HA.
- Total CPU: Общий процент процессора, используемого виртуальной машиной.
- Hypervisor CPU: Процент процессора гипервизора, используемый виртуальной машиной.
- Guest CPU: Процент от ЦП хоста, используемого виртуальной машиной.
События
- Event [x]: Описание события x, произошедшего в системе. Одно будет создано для каждого события, обнаруженного в затронутых Агентах.
Управление и визуализация архитектуры RHEV
В этом разделе описывается установка, настройка и работа расширений RHEV View и RHEV Manager.
Задачи распознавания
Существует возможность создания пользовательских задач распознавания благодаря Discovery server.
Установка расширений RHEV View и RHEV Manager
Для установки расширений необходимо просто скопировать содержимое папки extensions
, которую вы найдете при распаковке плагина, в соответствующую папку extensions
части Enterprise консоли Pandora FMS. Команда для выполнения выглядит следующим образом:
cp -R extensions/* <pandora_console_dir>/enterprise/extensions/
С этого момента будут доступны расширения для мониторинга RHEV.
Использование расширения RHEV View
Чтобы использовать расширение RHEV View, просто нажмите на опцию RHEV View в подменю; Monitoring.
Расширение отобразит карту, подобную следующей, со всеми компонентами архитектуры RHEV, обнаруженными плагином:
На карте показаны различные элементы архитектуры RHEV (Data Centers, Storage Domains, Clusters, Networks, Hosts и Virtual machines). Каждый элемент представлен иконкой, различной для каждого типа элемента архитектуры. Также показаны взаимосвязи между различными элементами архитектуры RHEV. С помощью этого вида очень легко увидеть состояние элементов и то, как они взаимосвязаны.
Расширение имеет меню, которое позволяет настраивать вид, скрывая или показывая объекты, увеличивая или уменьшая размер текста и выполняя zoom для более детального просмотра изображения.
Например, на следующем изображении карты мы скрыли элементы Networks, Hosts и Virtual Machine архитектуры, потому что нам нужно детально увидеть взаимосвязи кластеров и доменов хранения с центрами обработки данных.
Использование расширения RHEV Manager
Расширение RHEV Manager доступно в просмотре операций агентов Pandora FMS, которые соответствуют виртуальным машинам в архитектуре виртуализации RHEV.
Это расширение использует команду curl, поэтому необходимо, чтобы оно было установлено и доступно для веб-сервера, поддерживающего Консоль Pandora FMS.
Для доступа к расширению нажмите на кнопку с логотипом Red Hat, которую вы найдете вместе с другими вкладками агента.
Расширение позволяет управлять большим количеством виртуальных машин (включать, выключать и приостанавливать), не открывая консоль управления RHEV. Расширение показывает текущее состояние виртуальной машины с помощью цветового кода:
- Зеленый = Включена.
- Оранжеваый = На паузе.
- Серый = Остановлена.
С помощью выпадающего подменю можно увидеть доступные статусы и изменить статус виртуальной машины, нажав кнопку Change Status.
Если вы выберете состояние Stop для остановки виртуальной машины, расширение подключится к RHEV API и отправит команду. Результатом будет изменение состояния виртуальной машины и опций комбо:
Переход между некоторыми состояниями не является автоматическим, например, из состояния Stop в Start. В этом случае расширение будет показывать состояние виртуальной машины по мере ее изменения в архитектуре виртуализации. Пример:
Конфигурация плагина агента
Конфигурация плагина Агента осуществляется через конфигурационный файл, имя которого по умолчанию rhev-plugin.conf
.
По умолчанию плагин Агента выбирает все сущности и создает все соответствующие модули с определенными значениями для имени и для описания. Все эти аспекты, а также общие переменные плагина, могут быть настроены через конфигурационный файл.
Файл Конфигурации
Конфигурационный файл имеет две отдельные: общие переменные и конфигурация мониторинга.
Раздел глобальных переменных начинается с token Configuration и содержит информацию о конфигурации плагина. Допустимыми параметрами в этом разделе являются:
- module_name : Имя модуля агента со статусом выполнения плагина.
- server : Имя хоста, обслуживающего API RHEV.
- user : Пользователь в формате
user@domain
для подключения к API. - pass : Пароль для подключения к API.
- cert : Путь к сертификату для подключения к API.
- temporal : Временный каталог.
- logfile : Файл журнала или log.
- transfer_mode : Режим передачи. Может принять значения:
local
илиtentacle
. - tentacle_ip : IP-адрес сервера Tentacle, на который отправится информация. В основном он будет расположен на той же машине, что и сервер Pandora FMS. Эта опция используется, только если
transfer_mode
имеет значениеtentacle
. - tentacle_port : Порт сервера Tentacle. Эта опция используется, только если
transfer_mode
имеет значениеtentacle
. - tentacle_opts : Параметры отправки данных для Tentacle. Эта опция используется, только если
transfer_mode
имеет значениеtentacle
.
Раздел конфигурации мониторинга разделен на несколько подразделов. Первый подраздел имеет в качестве токена Reject и служит для создания списка объектов среды виртуализации, которые будут выброшены из мониторинга. Чтобы отбросить объект, необходимо внести его название в этот список. Например:
#Dismissed entities Reject mv1 mv_Windows10 mv_WebServer1 ...
Вы можете отбросить все объекты одного типа, например, все хосты, все виртуальные машины и т.д.. токены для каждого объекта следующие: all_dc (Data Center), all_host (Hosts), all_network (Networks), all_storage (Storage Domain), all_cluster (Cluster), all_vm (Виртуальные машины). Пример использования этих токенов:
#Dismissed entities Reject all_dc all_host all_network all_storage all_cluster all_vm
Вторая секция имеет в качестве токена Rename и используется для изменения имен объектов, отслеживаемых через плагин. Эта функция очень полезна, если вы хотите совместить мониторинг программных агентов с данными, извлекаемыми из API, в одном и том же Агенте Pandora FMS. Конфигурация этого раздела выполняется путем указания сначала старого имени, а затем нового, разделенных пробелом; например:
#Rename entities Rename mv_WebServer1 WebServer1 mv_Windows10 Windows10 Test ...
Конфигурация этого раздела выполняется путем указания сначала старого имени, а затем нового, разделенных пробелом; например: Каждый объект имеет свой собственный токен, представляющий собой следующее: DataCenter, StorageDomain, Network, Cluster, Host и VM. Для каждого из этих объектов можно определить модули, которые будут отключены, или задать пользовательские значения для имени, описания и максимального и минимального диапазонов для статусов. Warning
и Critical
. В качестве примера можно привести следующее:
#VM Modules VM status disabled errors_total_tx name = Ошибки TX Net [%s]; desc = Общее количество ошибок TX сети; limits = 60 70 71 100 memory_used name = Используемая память; desc = Память, используемая виртуальной машиной; limits = 256 1024 1025 2048 ...
Каждая строка конфигурации модулей мониторинга соответствует двум доступным опциям:
- <модуль> disabled: Модуль НЕ будет создан.
- <модуль> name = <имя>; desc = <описание>; limits = <min_warning> <max_warning> <min_critical> <max_critical» Модуль будет создан с указанным именем и описанием, а также будут определены пороговые значения для максимального и минимального значений.
Warning
иCritical
.
Очень важно иметь в виду структуру строк конфигурационного файла и прежде всего обратить внимание на то, чтобы символ ;
сопровождал имя и описание модуля. Эти две строки НЕ РАВНЫ (см. пробелы перед символом ;
):
errors_total_tx name = Ошибки TX Net [%s]; desc = Общее количество ошибок TX сети; limits = 60 70 71 100 #Правильно errors_total_tx name = Ошибки TX Net [%s]; desc = Общее количество ошибок TX сети ; limits = 60 70 71 100 #Неправильно
На модули ссылаются по их короткому имени - эквивалентному имени, которое легче набрать в командной строке. Таблица соответствия между краткими и расширенными названиями находится в следующем разделе.
Пример конфигурации для виртуальных машин, раздел VM:
Для мониторинга виртуальных машин был определен ряд модулей, включенных или нет, в разделе VM конфигурационного файла. Более конкретно: модуль status был отключен, а для модулей errors_total_tx и memory_used были определены пользовательские значения. Остальные модули, не появившиеся в списке, будут созданы со значениями по умолчанию. При такой конфигурации модуль memory_used будет принимать следующие значения:
- Имя: Используемая память.
- Описание: Память, используемая виртуальной машиной.
- Min Warning: 256.
- Max Warning: 1024.
- Min Critical: 1025.
- Max Critical: 2048.
Модули генерируются динамически; например, два, относящихся к дискам или интерфейсам, из которых один создается для каждого обнаруженного элемента. Они имеют специальный синтаксис для имени модуля, который выглядит следующим образом:
errors_total_tx name = Ошибки TX Net [%s]; desc = Общее количество ошибок TX сети; limits = 60 70 71 100
В этих случаях, поскольку имя имеет динамическую часть, допускается использование макроса %s
для замены плагином переменной части имени модуля.
Например, модуль errors_total_tx имеет имя по умолчанию:
Nic [nic1] errors TX
Теперь он будет называться
Ошибки TX Net [nic1]
Являясь nic1 динамической частью имени модуля.
Все ошибки, связанные с файлом конфигурации, отображаются в журнале, определенном в файле конфигурации, а также отправляются как синхронный модуль в Pandora FMS, который будет отражен как модуль внутри Агента, выполняющего плагин.
В дополнение к разделам для каждого элемента архитектуры, конфигурационный файл имеет общий раздел для Событий. Этот раздел определяется с помощью маркера EventCodes, и в нем будут перечислены коды событий, которые необходимо отслеживать, например:
EventCodes 30 920 980 509 956
Если вы не определите этот раздел, мониторинг событий не будет выполняться.
Разделите нагрузку по мониторингу между несколькими Программными Агентами
С помощью конфигурационного файла плагина Агента можно разделить нагрузку мониторинга инфраструктуры виртуализации RHEV.
Для этого объекты, подлежащие мониторингу, распределяются между различными Агентами. Предположим, у вас есть следующая архитектура:
DC1 | |- Cluster 1.1 |- c1.1mv1 |- c1.1mv2 |- c1.1mv3 |- Cluster 1.2 |- c1.2mv1 |- c1.2mv2 |- c1.2mv3 DC2 | |- Cluster 2.1 |- c2.1mv1 |- c2.1mv2 |- c2.1mv3 |- Cluster 2.2 |- c2.2mv1 |- c2.2mv2 |- c2.2mv3
Одним из способов разделения нагрузки может быть назначение одного Центра Обработки Данных (ЦОД) каждому из Программных агентов; для этого мы используем функцию отбрасывания объектов для мониторинга (token Reject).
Первый Программный Агент контролирует ЦОД DC1 и отбрасывает объекты DC2.
Reject DC2 Cluster 2.1 Cluster 2.2 c2.1mv1 c2.1mv2 c2.1mv3 c2.2mv1 c2.2mv2 c2.2mv3
Второй программный агент контролирует ЦОД DC2 и отбрасывает объекты DC1.
Reject DC1 Cluster 1.1 Cluster 1.2 c1.1mv1 c1.1mv2 c1.1mv3 c1.2mv1 c1.2mv2 c1.2mv3
Мы также можем разделить нагрузку на основе кластеров, например. Для каждого кластера из двух Центров Данных назначается агент из первых четырех.
Программный Агент 1, проводит мониторинг Кластера 1.1 и отбрасывает все остальные объекты.
Reject DC1 Cluster 1.2 c1.2mv1 c1.2mv2 c1.2mv3 DC2 Cluster 2.1 Cluster 2.2 c2.1mv1 c2.1mv2 c2.1mv3 c2.2mv1 c2.2mv2 c2.2mv3
Программный Агент 2, проводит мониторинг Кластера 1.2 и отбрасывает все остальные объекты.
Reject DC1 Cluster 1.1 c1.1mv1 c1.1mv2 c1.1mv3 DC2 Cluster 2.1 Cluster 2.2 c2.1mv1 c2.1mv2 c2.1mv3 c2.2mv1 c2.2mv2 c2.2mv3
Программный Агент 3, проводит мониторинг Кластера 2.1 и отбрасывает все остальные объекты.
Reject DC1 Cluster 1.1 Cluster 1.2 c1.1mv1 c1.1mv2 c1.1mv3 c1.2mv1 c1.2mv2 c1.2mv3 DC2 Cluster 2.2 c2.2mv1 c2.2mv2 c2.2mv3
Программный Агент 4, проводит мониторинг Кластера 2.2 и отбрасывает все остальные объекты.
Reject DC1 Cluster 1.1 Cluster 1.2 c1.1mv1 c1.1mv2 c1.1mv3 c1.2mv1 c1.2mv2 c1.2mv3 DC2 Cluster 2.1 c2.1mv1 c2.1mv2 c2.1mv3
Конфигурация отбрасываемых объектов является абсолютно гибкой, и можно разделить нагрузку, назначив несколько объектов каждому программному агенту.
Примеры файлов конфигурации
Архив со всеми отключенными модулями
#These lines are comments #Plugin configuration parameters Configuration server rhevm.server user user@testdomain pass 12345 cert /home/user/rhevm.cer temporal /tmp logfile /tmp/plugin-rhev.log transfer_mode local tentacle_ip 127.0.0.1 tentacle_port 41121 tentacle_opts #Dismissed entities Reject #Data Center modules Datacenter status disabled #StorageDomain modules StorageDomain available disabled used disabled committed disabled free_percent disabled #Networks modules Network status disabled stp disabled #Clusters modules Cluster overcommit disabled hugepages disabled threshold_low disabled threshold_high disabled threshold_duration disabled #Host Modules Host status disabled vm_active disabled vm_migrating disabled vm_total disabled data_current_rx disabled data_current_tx disabled errors_total_rx disabled errors_total_tx disabled memory_cached disabled memory_total disabled swap_free_percent disabled swap_cached_percent disabled swap_free disabled cpu_current_idle disabled cpu_current_user disabled memory_used disabled ksm_cpu_current disabled memory_free_percent disabled swap_total disabled memory_buffers disabled cpu_current_system disabled cpu_load_avg_5m disabled swap_cached disabled swap_used disabled memory_free disabled fence_status disabled #VM Modules VM status disabled stateless disabled ha disabled cpu_current_guest disabled cpu_current_hypervisor disabled memory_free_percent disabled memory_installed disabled memory_used disabled cpu_current_total disabled data_current_read disabled data_current_write disabled size disabled disk_status disabled data_current_rx disabled data_current_tx disabled errors_total_rx disabled errors_total_tx disabled
Таблица соответствия имен Модулей
Data Center
Полное Имя | Короткое Имя |
---|---|
Status | status |
Storage Domain
Полное Имя | Короткое Имя |
---|---|
Available Space | available |
Used Space | used |
Committed Space | committed |
Percent Free Space | free_percent |
Network
Полное Имя | Короткое Имя |
---|---|
Status | status |
STP Status | stp |
Cluster
Полное Имя | Короткое Имя |
---|---|
Overcommit Percent | overcommit |
Transparent HugePages | hugepages |
Low Threshold | threshold_low |
High Threshold | threshold_high |
Threshold duration | threshold_duration |
Host
Полное Имя | Короткое Имя |
---|
Status | status |
Active VM | vm_active |
Migrating VM | vm_migrating |
Total VM | vm_total |
Nic [x] RX | data_current_rx |
Nic [x] TX | data_current_tx |
Nic [x] errors RX | errors_total_rx |
Nic [x] errors TX | errors_total_tx |
Cache size | memory_cached |
Total memory | memory_total |
Swap free percent | swap_free_percent |
Swap cached percent | swap_cached_percent |
Swap free | swap_free |
CPU Idle | cpu_current_idle |
User CPU | cpu_current_user |
Used memory | memory_used |
KSM CPU | ksm_cpu_current |
Percent free memory | memory_free_percent |
Total swap | swap_total |
Buffers size | memory_buffers |
System CPU | cpu_current_system |
CPU Load | cpu_load_avg_5m |
Cached swap | swap_cached |
Used swap | swap_used |
Free memory | memory_free |
Fence Status | fence_status |
Virtual Machine
Полное Имя | Короткое Имя |
---|---|
Status | status |
Stateless | stateless |
HA Status | ha |
Guest CPU | cpu_current_guest |
Hypervisor CPU | cpu_current_hypervisor |
Percent free memory | memory_free_percent |
Installed memory | memory_installed |
Used memory | memory_used |
Total CPU | cpu_current_total |
Disk [x] read | data_current_read |
Disk [x] write | data_current_write |
Disk [x] size | size |
Disk [x] status | disk_status |
Nic [x] RX | data_current_rx |
Nic [x] TX | data_current_tx |
Nic [x] errors RX | errors_total_rx |
Nic [x] errors TX | errors_total_tx |
Nutanix
Гиперконвергентное решение Nutanix обеспечивает возможность управления всеми сетевыми, дисковыми, вычислительными ресурсами и памятью из одной точки.
Плагин Мониторинга Pandora FMS для Nutanix® позволяет нам постоянно контролировать состояние нашего решения Nutanix®.
Как работает плагин Nutanix
плагин Nutanix® это программа на языке Perl, которая подключается к API REST Nutanix PRISM®, получая необходимые метрики для мониторинга следующих элементов:
- Clusters Nutanix®.
- Устройства хранения.
- Контейнеры.
- Виртуальные машины.
- Хосты.
- Состояние процессов репликации.
Требования для плагина Nutanix
Для того чтобы получить информацию из REST API, вам необходимо:
- IP-адрес/ FQDN портала.
- Пользователь с разрешениями на чтение API.
- Пароль этого пользователя.
Для передачи результатов мониторинга в систему Pandora FMS, вам необходимо:
- Способ передачи информации, локальный или через Tentacle.
- Если способ передачи информации локальный, то адрес каталога, куда должны быть доставлены XML-файлы с результатами, а также права на запись в этом каталоге.
- Если способ передачи информации осуществляется с помощью Tentacle, необходимо иметь возможность подключаться к IP-адресу или FQDN сервера Pandora FMS, порту, используемому вашей установкой Tentacle, местоположению клиента Tentacle, а также к любой необычной опции, которую вы определили.
Установка Плагина Nutanix
Загрузите файлы, необходимые для работы плагина из Библиотеки Модулей. Переместите файлы на удаленную машину, с которой вы хотите осуществлять мониторинг инфраструктуры Nutanix, и извлеките файлы плагина:
tar xvzf pandora_nutanix.tar.gz
Настройка Плагина Nutanix
Определяются следующие поля
Nutanix API configuration
nx_fqdn
Адрес главного сервера Prism.
nx_port
Порт, на котором публикуется REST API (по умолчанию 9440).
nx_user
Пользователь с правами чтения на REST API.
nx_pass
Пароль данного пользователя.
use_https
Использовать https (1) или нет (0)
nx_rest_version
Версия API Rest (по умолчанию 'v1').
Nutanix agent configuration
agent_interval
Интервал агентов, генерируемых плагином. (по умолчанию 300)
agent_group
Группа, к которой будут принадлежать создаваемые Агенты (если вы закомментируете 'autocreate_group' в конфигурации вашего PandoraServer), по умолчанию Nutanix
.
module_interval
Интервал Модулей сгенерированных агентов (коэффициент умножения, по умолчанию 1).
module_tags
Метки, связанные с новыми модулями сгенерированных агентов.
module_group
Группа, к которой будут принадлежать новые модули.
Конфигурация связи с сервером Pandora FMS
mode
Режим передачи данных, «локальный» или «tentacle».
tentacle_ip
IP-адрес сервера Pandora FMS, применяется только в режиме Tentacle
tentacle_port
Порт, на котором прослушивает служба Tentacle.
tentacle_opts
Любые дополнительные опции, которые вы настроили в службе Tentacle.
tentacle_client
Полный маршрут к вашему клиенту Tentacle.
temp
Временный рабочий каталог.
local_folder
Маршрут доставки для режима передачи данных «local».
Фильтры
cluster_monitoring
Включать (1) или не включать (0) мониторинг кластеров.
storage_monitoring
Включать (1) или не включать (0) мониторинг устройств хранения.
container_monitoring
Включать (1) или не включать (0) мониторинг контейнеров для хранения.
vm_monitoring
Включать (1) или не включать (0) мониторинг виртуальных машин.
host_monitoring
Включать (1) или не включать (0) мониторинг серверов виртуальных машин (узлы Nutanix).
pd_monitoring
Включать (1) или не включать (0) мониторинг защитных доменов.
Пользовательские настройки
cluster_agent_header
Заголовок для имени Агента устройств типа cluster.
storage_agent_header
Заголовок для имени Агента устройств типа устройство хранения.
host_agent_header
Заголовок для имени Агента устройств типа сервер виртуальных машин (узлы Nutanix).
container_agent_header
Заголовок для имени Агента устройств типа контейнеры для хранения.
vm_agent_header
Заголовок для имени Агента устройств типа виртуальная машина.
pd_agent_header
Заголовок для имени Агента устройств типа защитный домен.
Правила генерации модулей
vm_stat
Правило для добавления модулей для мониторинга виртуальных машин, по умолчанию hypervisor_cpu_usage_ppm|hypervisor_memory_usage_ppm|.*avg.*
, это указывает на неординарные модули, которые будут сгенерированы, если имя метрики соответствует регулярным выражениям, указанным в этом поле. Добавьте значение .*
, чтобы отслеживать все доступные метрики.
host_stat
Правило добавления модулей для мониторинга серверов виртуальных машин (узлы Nutanix), по умолчанию hypervisor_cpu_usage_ppm|hypervisor_memory_usage_ppm|.*avg.*
, это указывает на неординарные модули, которые будут сгенерированы, если имя метрики соответствует регулярным выражениям, указанным в этом поле. Добавьте значение .*
, чтобы отслеживать все доступные метрики.
pd_stat
Правило объединения модулей для мониторинга доменов защиты, по умолчанию replication_transmitted_bandwidth_kBps|replication_total_transmitted_bytes
, это указывает на неординарные модули, которые будут сгенерированы, если имя метрики соответствует регулярным выражениям, указанным в этом поле. Добавьте значение .*
, чтобы отслеживать все доступные метрики.
Переименование объектов
RENAME aaa TO bbb
Правило для переименования объектов, вы можете определить столько каталогов, сколько элементов вам нужно переименовать.
Исключение объектов
REJECT aaa
Правило для исключения мониторинга объектов, вы можете определить столько каталогов, сколько элементов вам нужно исключить.
Выполнение плагина Nutanix
Рекомендуется запускать плагин удаленно с компьютера, имеющего доступ как к Pandora Server, так и к вашей инфраструктуре Nutanix® для мониторинга.
Ручное выполнение:
./pandora_nutanix-linux-x64 pandora_nutanix.conf
Вы можете автоматизировать выполнение плагина в системе cron, добавив следующую строку в /etc/crontab
>
- /5 * * * * root /path/to/plugin/pandora_nutanix-linux-x64 /path/to/plugin/pandora_nutanix.conf
Результаты плагина Nutanix
Снимок экрана с результатами, полученными с помощью плагина:
Пример карты архитектуры Nutanix®:
Пример представления Агента архитектуры Nutanix®:
Пример вида модулей для Агентов типа Host Nutanix®:
XenServer
Xen - это средство контроля виртуальных машин с открытым исходным кодом, разработанный Кембриджским университетом.
Целью разработки является возможность запускать экземпляры операционных систем со всеми их функциями в полнофункциональном режиме на простом компьютере. Вы можете получить интересную информацию о том, «Как мониторить Citrix XenServer с помощью Pandora FMS» в блоге Pandora FMS.
Xen обеспечивает безопасную изоляцию, контроль ресурсов, гарантии качества обслуживания и горячую миграцию виртуальных машин. Операционные системы могут быть явно модифицированы для запуска Xen (при сохранении совместимости с пользовательскими приложениями). Это позволяет Xen достичь высокой производительности виртуализации без специальной аппаратной поддержки.
Intel внесла несколько дополнений в Xen, которые позволили добавить поддержку ее расширений архитектуры VT-X Vanderpool. Эта технология позволяет немодифицированным операционным системам выступать в качестве хостов внутри виртуальных машин Xen, если физический сервер поддерживает расширения VT от Intel или Pacifica от AMD.
Работа плагина XenServer
Плагин Pandora FMS для мониторинга сред Xen написан на языке Python. Использует XenAPI для получения всей необходимой информации. Позволяет контролировать следующие типы элементов:
- Виртуализированные системы в Xen.
- Ресурсы хранения.
- Собственный сервер Xen (host).
Требования для плагина XenServer
Необходимо, чтобы система, на которой работает плагин, выполняла следующие требования:
- Установлен Python
- Установлены библиотеки Python:
- XenAPI
- xmltodict
- Доступ к API вашего XenServer (web, включите трафик с устройства, на котором запущен плагин, на порт 443 или 80 XenServer).
- Рекомендуется, чтобы на виртуальных машинах были установлены инструменты Xen Server Tools, поскольку в противном случае доступная информация довольно скудна.
Плагин был успешно протестирован на системах XenServer 6.5 и 7.2
Установка плагина
Загрузите свою копию плагина Pandora FMS для XenServer из библиотеки модулей. Вы можете развернуть его на компьютере, который вы предпочитаете (Windows® или Linux®), извлекая содержимое файла в энергонезависимый каталог, откуда вы можете запустить его, используя либо Pandora FMS Agent, либо системный cron.
Конфигурация плагина
Доступная конфигурация для плагина Pandora FMS для Xen:
Блок конфигурации [CONF]
xen_server_ip
IP/FQDN-адрес сервера Xen
user
Пользователь с правами на запрос API Xen
password
Пароль пользователя
temporal
Каталог временных работ
Блок конфигурации [PANDORA]
tentacle_client
Расположение двоичного файла клиента Tentacle
tentacle_ip
IP-адрес, по которому прослушивает служба Tentacle.
tentacle_port
Порт, на котором прослушивает служба Tentacle.
logfile
Полный путь к файлу журнала
interval
Интервал сгенерированных агентов
group
Группа, назначенная сгенерированным агентам.
Блок конфигурации [TUNNING]
time_adjustment
Параметр, позволяющий настроить возможную разницу во времени между компьютером, на котором запущен плагин, и сервером Xen. (по умолчанию=10, измеряется в секундах)
scan_vm_ip
Параметр, позволяющий определить, пытается ли плагин получить IP-адреса виртуальных машин с сервера Xen. Можно взять только IP-адреса тех ВМ, на которых установлен XenTools. Вы можете включить (scan_vm_ip=true) или выключить (scan_vm_ip=false). Если не указано, считается включенным.
Блок конфигурации [RENAME]
xen_element_name = pandora_agent_name
В этом блоке вы можете определить столько вводных данных, сколько хотите, с данным форматом. Позволяет изменить имена элементов Xen Server на другие, которые будут использоваться в качестве имен агентов в Pandora FMS. Вы можете переименовывать ВМ, СР и сам сервер Xen. Например:
[RENAME] example-xen-server=Example Xen Server Example Xen Server 2=example-xen-server-2 example-vm=Example VM Example VM 2=example-vm-2 example-sr=Example SR Example SR 2=example-sr-2**
Даже если в именах есть пробелы, они не должны заключаться в кавычки.
Выполнение плагина
Вы можете запланировать выполнение плагина из любого агента Pandora FMS, добавив в его конфигурацию следующее:
module_plugin python "<ruta>\xen-plugin.py" "<ruta>\xen-plugin.conf"
Чтобы запрограммировать его через систему cron, вы можете добавить следующую строку в /etc/crontab:
/5 * * * * root python "<ruta>\xen-plugin.py" "<ruta>\xen-plugin.conf"> /dev/null 2>&1
Если вы запустите плагин вручную, результат должен выглядеть следующим образом:
python "<ruta>\xen-plugin.py" "<ruta>\xen-plugin.conf" <module> <name><![CDATA[XenServer Plugin]]></name> <type><![CDATA[async_string]]></type> <description><![CDATA[Result of XenServer Plugin execution]]></description> <data><![CDATA[OK]]></data> </module>
Результаты плагина XenServer
Снимок экрана с результатами, полученными с помощью плагина:
Пример карты архитектуры Xen:
Пример вида Агента архитектуры Xen:
Пример вида модулей для Агентов типа Host Xen:
OpenNebula
OpenNebula - это платформа облачных вычислений для распределенных и гетерогенных центров обработки данных, предоставляющая виртуальную инфраструктуру для создания частных облаков, публичных облаков и гибридных развертываний инфраструктуры как услуги (IaaS).
OpenNebula - это программное обеспечение open source с лицензией Apache 2.
Работа плагина OpenNebula
Плагин Pandora FMS для мониторинга сред OpenNebula написан на языке Perl. Он выполняется локально на сервере OpenNebula и получает всю необходимую информацию с помощью собственных команд управления OpenNebula. Позволяет контролировать следующие типы элементов:
- Clusters.
- Хосты.
- Виртуальные машины.
- Ресурсы хранения.
Требования для плагина OpenNebula
Необходимо, чтобы система, на которой работает плагин, выполняла следующие требования:
- Perl, доступный на вашем компьютере
- Пользователь с привилегиями на выполнение следующих команд:
onehost
.onecluster
.onedatastore
.
Работа плагина была успешно протестирована в системах OpenNebula 5.X.X .
Установка плагина
Загрузите свою копию плагина Pandora FMS для OpenNebula из библиотеки модулей.. Вы должны извлечь содержимое файла в энергонезависимый каталог, откуда вы сможете выполнить его, используя либо агент Pandora FMS, либо системный cron.
unzip pandora_OpenNebula.zip
Конфигурация плагина
Конфигурация, доступная для плагина Pandora FMS для OpenNebula.
Конфигурация связи с сервером Pandora FMS
mode
Режим передачи данных, «локальный» или «tentacle».
tentacle_ip
IP-адрес сервера Pandora FMS, применяется только в режиме tentacle.
tentacle_port
Порт, на котором прослушивает служба Tentacle.
tentacle_opts
Любые дополнительные опции, которые вы настроили в службе Tentacle.
tentacle_client
Полный маршрут к вашему клиенту Tentacle.
temp
Временный рабочий каталог.
local_folder
Маршрут доставки для режима передачи данных «local».
Конфигурация Агента
agent_interval
Интервал агента, по умолчанию 300.
agent_group
Группа агентов, по умолчанию OpenNebula.
Персонализация Модулей
module_group
Группа модулей, по умолчанию OpenNebula.
module_interval
Интервал модуля (множитель), по умолчанию 1.
module_tags
Этикетки для модулей.
Персонализация имени
cluster_agent_header
Заголовок для имени Агента устройств типа cluster.
host_agent_header
Заголовок для имени Агента устройств типа сервер виртуальных машин.
storage_agent_header
Заголовок для имени Агента устройств типа устройство хранения.
vm_agent_header
Заголовок для имени Агента устройств типа виртуальная машина.
Фильтры
cluster_monitoring
Включать (1) или не включать (0) мониторинг кластеров.
host_monitoring
Включать (1) или не включать (0) мониторинг серверов виртуальных машин.
storage_monitoring
Включать (1) или не включать (0) мониторинг устройств хранения.
vm_monitoring
Включать (1) или не включать (0) мониторинг виртуальных машин
Переименование объектов
RENAME aaa TO bbb
Правило для переименования объектов, вы можете определить столько каталогов, сколько элементов вам нужно переименовать.
Исключение объектов
REJECT aaa
Правило для исключения мониторинга объектов, вы можете определить столько каталогов, сколько элементов вам нужно исключить.
Выполнение плагина
Чтобы запрограммировать его через систему cron, вы можете добавить следующую строку в /etc/crontab:
/5 * * * * root "<ruta>/pandora_opennebula" "<ruta>/pandora_opennebula.conf"> /dev/null 2>&1
Если вы запустите плагин вручную, результат должен выглядеть следующим образом:
[root@valhalla ~]# ./pandora_opennebula pandora_opennebula.conf [root@valhalla ~]# echo $? 0
Результаты плагина OpenNebula
Список модулей, созданных плагином OpenNebula:
Для Hosts:
- Available CPU
- Available Disk
- Available memory
- Error reported by OpenNebula
- State
- Total zombies
- VMs running
Для устройств хранения данных:
- Disk Free %
Для виртуальных машин:
- Assigned CPU
- Assigned Memory
- Network RX
- Network TX
- State
- Time running
Пример карты архитектуры OpenNebula:
IBM HMC
Этот плагин позволяет контролировать машины виртуализации IBM AIX через консоль управления оборудованием HMC. Этот плагин будет собирать информацию из всех логических разделов, созданных в среде AIX, управляемой системой HMC, создавая агента для каждого управляемого сервера, каждого логического раздела и каждого виртуального сервера IO.
Для сбора информации через SSH плагин может использовать три рабочих режима:
- Основываясь на expect с использованием el
script ssh_launcher.sh
. - Основываясь на библиотеке
Net::SSH::Perl
- Основываясь на библиотеке
Net::SSH::Expect
Чтобы дополнить собранную информацию, будут также сделаны запросы к REST API, по умолчанию в:
https://fqdn:12443/rest/api/{root_element}
Требования
Необходимые параметры, которые должны быть предоставлены областью, нуждающейся в мониторинге, следующие:
- Имя пользователя для аутентификации в системе HMC (только чтение).
- Пользователь должен иметь разрешение на подключение к REST API, вход в оболочку HMC и выполнение следующих команд (минимальные требования):
- lssyscfg
- lshwres
- пароль данного пользователя.
- Местоположение (FQDN/IP) HMC (например,
myhmc.mydomain
) - Базовый URL-адрес остального API HMC, например:
https://myhmc.mydomain:12443
Модули, генерируемые плагинами
Параметры, контролируемые плагином, следующие (сгруппированы по типу элемента):
- Current logical partitions
- Max logical partitions
- Max memory available
- Max memory installed
- Proc pool DefaultPool current proc units
- Proc pool DefaultPool max proc units
- Proc pool DevelopmentPool current proc units
- Proc pool DevelopmentPool max proc units
- Proc pool ProductionPool current proc units
- Proc pool ProductionPool max proc units
- Proc pool TestPool current proc units
- Proc pool TestPool max proc units
- Proc pool VIOPool current proc units
- Proc pool VIOPool max proc units
- Processor pools configured
- Processor units available
- Processor units installed
- State
- uuid
- Virtual proc units max
LPAR:
- Auto start : Конфигурация автозапуска логического раздела.
- LPAR type : Тип логического раздела.
- LPAR UUID : Используется для запроса API HMC.
- Max memory : Максимальная память.
- Max memory : Доступная память.
- Processor units available : Доступные процессорные блоки.
- Processor units current : Текущие процессорные блоки
- RMC IP address : IP-адрес RMC.
- RMC state : Состояние RMC в LPAR
- State : Статус логического раздела.
- Virtual proc units : Виртуальные процессорные блоки, назначенные этой системе LPAR.
Virtual IO:
- Auto start : Конфигурация автозапуска логического раздела.
- LPAR type : Тип логического раздела.
- LPAR UUID : Используется для запроса API HMC.
- Max memory : Максимальная память.
- Max memory current : Доступная память..
- Processor units available: Доступные процессорные блоки
- Processor units current : Текущие процессорные блоки
- RMC IP address : IP-адрес RMC.
- RMC state RMC : Состояние RMC в LPAR.
- State : Статус логического раздела.
- Virtual proc units : Виртуальные процессорные блоки, назначенные этой системе LPAR.
Конфигурация плагина IBM HMC
Доступная конфигурация для плагина Pandora FMS для IBM HMC:
Конфигурация связи с сервером Pandora FMS
mode
Режим передачи данных, «локальный» или «tentacle».
tentacle_ip
IP-адрес сервера Pandora FMS, применяется только в режиме tentacle.
tentacle_port
Порт, на котором прослушивает служба Tentacle.
tentacle_opts
Любые дополнительные опции, которые вы настроили в службе tentacle.
tentacle_client
Полный маршрут к вашему клиенту Tentacle.
temp
Временный рабочий каталог.
local_folder
Маршрут доставки для режима передачи данных «local».
Конфигурация доступа к HMC
hmc_host
IP или FQDN для HMC
hmc_user
Пользователь с правом чтения
hmc_pass
Пароль
as_agent_plugin
Выходные данные плагина возвращаются в формате XML для запланированного выполнения с помощью Агента Pandora FMS ( as_agent_plugin = 1
). Или стандартный вывод ( as_agent_plugin = 0
) для выполнения, запланированного с помощью системного cron или выполняемого как серверный плагин.
Конфигурация Агента
agent_name
Необязательно, введите имя для родительского агента, по умолчанию `hostname`
agent_interval
Интервал агента, по умолчанию 300.
agent_group
Группа Агента по умолчанию IBM
Персонализация Модулей
module_group
Группа модулей, по умолчанию IBM.
module_interval
Интервал модуля (множитель), по умолчанию 1.
module_tags
Этикетки для модулей
Переименование объектов
Для переименования объектов используется переименование по блокам:
rename MyLPAR_NAME TO my new name MyLPAR_NAME2 TO my second new name rename_end