Победа достается не тому, кто взял вес - а тому, кто удержал

Еще одна "пингалка"?

Проверить по сети, что сервер работает, страничка загружается, и отправить письмо, если что-то не так - дело нехитрое. И уже существует 100500 сервисов для этого. Зачем нужен еще один?

У okerr есть несколько интересных и необычных возможностей:

  • Основан на открытых стандартах, легко интегрируется с любой информационной системой, способен выполнять проверки не только "снаружи", но и "изнутри".
  • В первую очередь ориентирован не на количественные показатели (он не покажет среднее время загрузки страницы с сервера в Висконсине, и не нарисует красивый волнистый график нагрузки на СУБД ), а на качественные. Неважно "сколько", важно другое - нужно вам отложить свои дела и разбираться с ситуацией - или нет.
  • Поддерживает мощный язык логических выражений, что позволяет избежать ложных срабатываний.
  • Возможность технически обеспечить административные решения (напр. "Исправление проблемы должно начаться не позднее 15 минут после ее обнаружения", "Запланированные работы проводятся только с 2 до 4 ночи.")

Контролируйте ВСЁ

Размер свободного места на дисках, курс доллара, время восхода солнца, количество заказов за последний час в интернет-магазине.

Солнце не взошло? Доллар упал до 60 копеек? Почему-то вдруг на 40% упали продажи в интернет-магазине (может тормозит сервер базы данных, или кончился товар, а может магазин исчез с первой страницы результатов поиска)? Узнайте про это сразу же, и извлеките из ситуации пользу, или минимизируйте ущерб.

okerr имеет открытую архитектуру, что позволяет легко подлючать любые свои проверки.

С мозгами все интереснее

Полноценный язык логических выражений с синтаксисом языка Python позволяет надежно избавиться от ложных срабатываний (false positives). Например, вы можете настроить систему, чтобы она не устраивала истерику по поводу сервера, если в интервале с 4 до 5 утра сервер недоступен в течение не более 20 минут, и при этом работают хотя бы два сервера из кластера.

За оповещениями от okerr стоит простой принцип - оповещение должно требовать вашей реакции на него. Если реакция не требуется - вы не должны быть побеспокоены ложным оповещением.

Работа в команде

Создавайте разные проекты внутри okerr и управляйте правами доступа к ним.

Контролируйте качество работы системных администраторов:

  • Когда okerr обнаружил проблему.
  • Когда администратор начал работу по исправлению
  • Когда работа завершилась и в мире снова воцарилась гармония
  • Остальные сервисы не поломались от усердного и интенсивного исправления этой проблемы
okerr предоставляет возможности для этого.

Эскалация

Через логический модуль, можно настроить эскалацию уровня "тревоги". Например:

  • В рабочее время, даже мелкие аномалии вызывают оповещение, чтобы можно было "на живую" разобраться в них. (Часто причину технических проблем очень сложно обнаружить, когда проблема уже "сама ушла").
  • В остальное время, команда администраторов получает оповещения только в случае достаточно важных проблем, которые не проходят сами.
  • Если же проблема не устранена в течение 4 часов - оповещение получает руководитель IT службы

А это оказалось несложно!

У нас есть неплохая документация и легкий набор quick-start уроков, чтобы за короткое время и без усилий научиться пользоваться основными функциями системы.

Облака редко падают

okerr - решение для внешнего мониторинга. В этом есть ряд плюсов.

  • Вы получите извещение о проблеме, даже если ваш почтовый сервер не работает (медленно работает) или не имеет связи с сетью.
  • Если сервер долго не подтверждает, что все хорошо - okerr сам догадывается, что это нехорошо
Конечно, наш сервис okerr тоже может "упасть". Но врядли это случится в тот же момент, как и проблемы с вашими серверами.

Сделал и забыл

okerr - привнесет в жизнь покой и уверенность, но не претендует на то, чтобы стать частью вашей жизни. После того как вы один раз хорошо настроили проверки - вам не нужно больше даже заходить в okerr - просто читайте ежедневные сводки и иногда оповещения о проблемах, которые требуют вашего вмешательства.

А время своей жизни - лучше тратить не на слежение за серверами, а на алкоголь, карточные игры и распутных женщин.

Бесплатно.

Даже небольшие и скромные проекты должны иметь возможность качественного мониторинга.


Через 10 минут, вы установите наблюдение за своим вебсайтом, через 30 минут - за всеми основными параметрами ключевых серверов, еще через 20 минут у вас будет собственный модуль для контроля какого-нибудь вашего самописного приложения и уже к концу дня вы овладеете большинством функций okerr и сможете настроить сколь угодно большую и сложную схему мониторинга.