Существуют различные позиции относительно того, являются ли наблюдаемость и мониторинг двумя сторонами одной медали.

Мы проанализируем и объясним, что такое наблюдаемость системы, как она связана с мониторингом и почему важно понимать различия между ними.

Что такое наблюдаемость?

Если придерживаться точного определения понятия наблюдаемости, то наблюдаемость – это не что иное, как мера, определяющая, как внутренние состояния могут быть выведены из внешних выходов.

То есть, мы можем сделать вывод о состоянии системы в данный момент, если нам известны только выходы этой системы.

Но давайте рассмотрим это лучше на примере.

Как связаны между собой наблюдаемость и мониторинг? Практический пример

Некоторые говорят, что мониторинг обеспечивает ситуационную осведомленность, а наблюдаемость (способность наблюдать) помогает определить, что происходит и что с этим нужно делать.

А как же анализ первопричин, который системы мониторинга обеспечивают уже более десяти лет?

А как насчет корреляции событий, которая вызвала столько головной боли?

Обе концепции по сути являются тем, что обещает наблюдаемость, а это не что иное, как добавление измерений к нашему пониманию окружающей среды. Способность смотреть (или наблюдать) на сложность в целом и понимать, что происходит.

Давайте рассмотрим пример:

Предположим, что наш бизнес зависит от яблони. Мы продаем яблоки, и наше дерево должно быть здоровым.

Мы можем измерить PH почвы, влажность, температуру дерева и даже наличие вредных для растения насекомых.

Измерение каждого из этих параметров является мониторингом здоровья дерева, но по отдельности это просто данные без контекста, с пороговыми значениями, которые могут разграничить, что хорошо, а что плохо.

Когда мы смотрим на это дерево и видим эти показатели на бумаге, мы знаем, что оно здорово, потому что у нас есть представление о том, каким должно быть здоровое дерево.

В этом и заключается разница между наблюдением и мониторингом.

Вы можете сдать анализ крови, но при этом вы увидите только некоторые конкретные показатели.

Если у вас есть сомнения в своем здоровье, вы идете к врачу, который наблюдает вас и, используя данные анализов, проводит дополнительные исследования или отправляет вас домой, похлопав по спине.

Наблюдение – это то, что воспитывает наблюдательность.

Мы говорим не о новой концепции, мы заново открываем порох.

Справедливости ради следует отметить, что порох может быть мощным оружием или использоваться просто для фейерверков.

Путь к наблюдаемости

Одна из эндемических проблем мониторинга – вертикальность.

Наличие изолированных “силосов” знаний и технологий, которые мало контактируют друг с другом.

Сети, приложения, серверы, системы хранения данных.

Они не только мало связаны друг с другом, но иногда инструменты и команды, которые ими управляют, являются независимыми.

Возвращаясь к нашему примеру, можно сказать, что яблоня умирает, и мы спрашиваем каждого эксперта отдельно:

  • Наш эксперт по почвам сказал бы нам, что это нормально.
  • Наш эксперт по насекомым сказал бы нам, что это нормально.
  • Наш метеоролог сказал бы нам, что все в порядке.

Возможно, червь, съевший дерево, отразил странный всплеск PH почвы, и все это произошло в субтропический штормовой день.

По отдельности эти данные не вызывали тревоги, а если и вызывали, то корректировались самостоятельно, но все сигналы вместе должны были предвещать нечто худшее.

Первый шаг в достижении наблюдаемости – это возможность собрать в одном месте метрики из разных областей/сред. Затем мы можем анализировать, сравнивать, смешивать и интерпретировать их.

То, о чем Pandora FMS говорит уже почти десять лет: иметь единый инструмент мониторинга, чтобы видеть все.

Но это только первый шаг, давайте продолжим.

Ошибается ли доктор Хаус, когда говорит, что все лгут?

Вернее, каждый рассказывает то, что, как ему кажется, он знает.

Если вы спросите сервер на сетевом уровне, все ли в порядке, он ответит “да”.

Если нет подключения к сети, а приложение находится в идеальном состоянии, и вы спросите его на уровне приложения, все ли в порядке, оно ответит вам, что все в порядке.

В обоих случаях услуги не предоставляются.

И мы скажем себе: что значит “все в порядке”, это не работает!

Вот почему наблюдаемость и мониторинг – это не одно и то же.

Именно обработка всех сигналов позволяет поставить диагноз, а диагноз – это нечто гораздо более ценное, чем просто данные.

Что лучше – наблюдение или мониторинг?

Неправильно.

Если вы задаете себе этот вопрос, значит, мы не поняли друг друга.

Лучше пойти к врачу или просто сдать анализы?

Это зависит от того, что поставлено на карту.

Если это важно, следует соблюдать все имеющиеся данные.

Если вас беспокоит что-то очень конкретное и вы знаете, о чем говорите, может быть достаточно отслеживать изолированный набор данных.

Вы уверены, что можете позволить себе только мониторинг?

Поиск иголки в стоге сена

Среди такого количества данных, с тысячами метрик, вопрос заключается в том, как получить релевантную информацию среди такого количества мусора. Верно?

AIOPS, корреляция, большие данные, анализ первопричин…

Это еще одно выдуманное слово для того же самого?

Возможно, но в конечном итоге это более глубокое и осмысленное размышление:

Что толку от такого количества данных (Bigdata), если у меня нет возможности использовать их анализ в практических целях?

В чем смысл таких технологий, как AIOPS, если мы не можем собрать и получить доступ ко всем различным данным из всех наших систем?

Прежде чем приступить к черной магии, необходимо получить необходимые ингредиенты, иначе все это лишь обещания и дорогостоящие инвестиции, которые приводят к напрасной трате времени и неприятному чувству, что нас обманули.

От мониторинга к наблюдаемости

Чтобы поднять мониторинг до новой парадигмы наблюдаемости, мы должны собрать как можно больше данных для анализа.

Но как их получить?

С помощью инструмента мониторинга.

Да, такой инструмент, как Pandora FMS, который может собрать всю информацию в единое целое, без различных частей или составления Франкенштейна, о котором мы даже не знаем, сколько он стоит и как он собран.

И мы не говорим об “Икее” мониторинга, состоящей из сотен деталей, требующих времени, денег и… много времени.

Это не ново.

Также не факт, что нам нужен инструмент мониторинга, который может собирать данные из любого домена.

Например, данные коммутатора, сопоставленные с данными одновременного пользователя SAP.

Данные о задержке с временем сессии веб-транзакции.

Температура в Кельвинах танцует рядом с евроцентами, положительные удары сердца внимательно смотрят на количество слотов, ожидающих в очереди сообщений.

Единственное, что имеет значение, – это бизнес.

Только окончательный вид.

Наблюдайте, понимайте и, прежде всего, решайте, что все в порядке, а если что-то не так, четко определите, кому звонить.

Что такое реальная наблюдаемость

Мы называем это служебными представлениями.

Это не сложно, мы предоставляем инструменты, чтобы вы, знающие свой бизнес, могли определить критические элементы и сформировать карту услуг, которая опирается на всю доступную информацию, откуда бы она ни поступала.

FMS компании Pandora расшифровывается как FLEXIBLE Monitoring System и предназначена для получения информации из любой системы, в любой ситуации и какой бы сложной она ни была, для ее хранения и возможности принятия решений и действий с ее помощью.

Наши лучшие клиенты сегодня – это те, у кого так много информации, что другие производители не знают, что с ней делать.

Мы тоже, не буду вас обманывать, но наши клиенты с нашей технологией – да.

Мы помогаем им обработать и осмыслить все это. Чтобы сделать его наблюдаемым.

Нам хотелось бы сказать, что мы обладаем некой магией, которой нет у других, но правда в том, что никакого таинственного секрета нет.

Мы берем информацию, откуда бы она ни поступала, какой бы она ни была, и делаем ее доступной для разработки карт обслуживания.

Некоторые из них являются полуавтоматическими, но клиенты, которые знают, что с ними делать, предпочитают четко определить, как их реализовать. Я настаиваю, они делают это сами, даже не просят нас о помощи.

Если вы хотите наблюдать, то сначала нужно все проконтролировать.

И в этом мы можем вам помочь.

Shares