
Алексей
27.06.2017
20:17:16
ну и что бы при выходе из строя одной не потерять данные надо что бы replication factor был 2.
думаю можно сделать 4 машины.
3 на зукипер и 2*2

Google

Алексей
27.06.2017
20:19:25
не проверял такой вариант

Bitbucket
28.06.2017
03:02:25
Dmitry Volodin pushed to noc/feature/microservices
Code cleanup
Dmitry Volodin pushed to noc/feature/microservices
Generic.get_metrics: Fix CapabilityListRule

Dmitry
28.06.2017
03:40:35
по планам у меня - переделка обработки порогов в метриках: оконные функции для вычисления порогов и переделка аварий на зонтики
сегодня выкачу на тесты
потом вернусь к ветке feature/config, добъю ее, чтобы взлетало и отдам @freeseacher на допиливание деплоя под нее
и запущу ветку feature/chpm с метриками в clickhouse
там возни побольше будет, придется дашборды перепиливать и графану дружить с CH
и скрипты пилить
и скейлинг пересчитывать весь

Bitbucket
28.06.2017
05:11:32
Dmitry Volodin pushed to noc/feature/microservices
discovery: window functions for thresholds and umbrella alarms

Ivan
28.06.2017
05:38:27

Google

Ivan
28.06.2017
05:39:25
Дима, сейчас кх что делает? У меня он пишет, что метрики коллектед в логах. Это только маки?

Dmitry
28.06.2017
05:39:41
да, это маки
и данные для bi

Ivan
28.06.2017
05:40:24
Значит, чисто теоретически, я могу делать запросы где мак
Ок
bi пока вообще не работает, мб вы скинете какие-нибудь шаблоны общественности?

Dmitry
28.06.2017
05:46:54
сказки какие, работает :)

Ivan
28.06.2017
05:48:24
У меня не работает, страница би пустая, одна шапка
Я уже говорил об этом

E_zombie
28.06.2017
06:07:34
https://pp.userapi.com/c637930/v637930151/67849/QwEVjHyptOA.jpg
https://pp.userapi.com/c637930/v637930151/6782e/zlv2vChMrnc.jpg

Алексей
28.06.2017
06:09:45

E_zombie
28.06.2017
06:10:13
мост саратов - энгельс

Bitbucket
28.06.2017
06:10:26
Dmitry Volodin pushed to noc/feature/microservices
discovery: Additional variables for threshold alarms

E_zombie
28.06.2017
06:10:39
в этом году сделали "оригинальную историческую" поддержку.

Алексей
28.06.2017
06:12:23
очень мило.

E_zombie
28.06.2017
06:12:50
положил тушку на паропет и выбержка в 15 сек

Gitlab
28.06.2017
06:42:59
Andrey Vertiprahov pushed to collections/AC_Metric_Treshold
Additional threshold alarm classes

E_zombie
28.06.2017
06:44:06
find ./collections/gis.layers/Addresses.json -name '*.json' | xargs ./noc collection install кто свободный сделайте у себя. у меня почемуто крешится.

Gitlab
28.06.2017
06:56:36
aversant opened merge request at / collections:
Additional threshold alarm classes
Additional metrics for thresholds.

Google

John
28.06.2017
07:03:13
парни, а как ноку объяснить cipher'ы?
ssh говорит no matching cipher found: client aes128-ctr,aes192-ctr,aes256-ctr,arcfour256,arcfour128,aes128-gcm@openssh.com,aes256-gcm@openssh.com,chacha20-poly1305@openssh.com,aes128-cbc,3des-cbc,blowfish-cbc,cast128-cbc,aes192-cbc,aes256-cbc,arcfour,rijndael-cbc@lysator.liu.se server des-cbc

Ivan
28.06.2017
07:05:12

E_zombie
28.06.2017
07:05:38
делаем багу ?

Ivan
28.06.2017
07:06:12
делай, я не знаю, что это за коллекции.
В миграции нет их?

E_zombie
28.06.2017
07:07:30
хз. но они есть в коллекциях .
вот думаю нужно ли оно там ваще
https://code.getnoc.com/noc/collections/issues/4

Gitlab
28.06.2017
07:23:46
Алексей Широких pushed to collections/master
aversant: Additional threshold alarm classes
Алексей Широких: Merge branch 'new/AC_Metric_Treshold' into 'master'
Additional threshold alarm classes
See merge request !81
Andrey Vertiprahov deleted branch collections/AC_Metric_Treshold

Bitbucket
28.06.2017
07:40:50
Dmitry Volodin pushed to noc/feature/microservices
chwriter: Additional logging

John
28.06.2017
08:04:57
Парни, так задумано что для пользователей ldap не доступна графана?

Ilya
28.06.2017
08:06:28
надо разрешения дать

John
28.06.2017
08:06:48
понял, навернно я где то прав не дал. Докавыряю

Ilya
28.06.2017
08:06:58
ага
там пряв в списке поищи grafana

Bitbucket
28.06.2017
08:10:35
Dmitry Volodin pushed to noc/feature/microservices
chwriter: Log deferring incoming messages

John
28.06.2017
08:10:50
в списке доступка в свойствах группы нет grafana. Но есть Dynamic Dashboard
(pm.ddash)
после этого и графана заработала вроде

Google

John
28.06.2017
08:12:01
Managed Objects
(sa.managedobject) выходит за рамки экрана, хз какие там галочки уехали за экран)

Ilya
28.06.2017
08:12:30

Bitbucket
28.06.2017
08:12:52
Dmitry Volodin pushed to noc/feature/microservices
InterfaceProfile: Additional metrics settings

John
28.06.2017
08:13:14
а смысле?

Ilya
28.06.2017
08:14:09

E_zombie
28.06.2017
08:14:29
чувствую что счас всё распидорасит опять

Dmitry
28.06.2017
08:17:14
какие правила по умолчанию?

Ilya
28.06.2017
08:18:10
какие правила по умолчанию?
+ # Severity weights
+ low_error_weight = IntField(default=10)
+ low_warn_weight = IntField(default=1)
+ high_warn_weight = IntField(default=1)
+ high_error_weight = IntField(default=10)

Admin
ERROR: S client not available

Ilya
28.06.2017
08:18:21
Это они и есть?
зачем window func, если такие значения?

Dmitry
28.06.2017
08:24:52
это веса для рассчета severity
сам механизм такой
раньше пороги считали по последнему значению
сейчас сделали оконные функции
все результаты измерения для метрики укладываются в окно
и оно сохраняетя в контексте job'а
окно задается настройками widown_type и window
если window_type == m, то в window указывается, сколько последних измерений хранить

Google

Dmitry
28.06.2017
08:30:45
если window_type == t, то в window указывается размер окна в секундах
когда окно полностью заполнено, вызывается оконная функция
по умолчанию - last, она возвращает результат последнего измерения
что соответсвует текущему поведению
и вот этот результат уже сравнивается с порогами
то есть теперь можно поднимать аварии, скажем, если средняя загрузка проца по измерениям за час больше 50%
или -- из 10 измерений по 5 зафиксированы превышения (q2)

Ilya
28.06.2017
08:33:25
Дима, классно!
Спасибо за описание

Dmitry
28.06.2017
08:33:54
кроме того теперь не одна авария на объект
а зонтик
на каждую метрику своя авария
и по ним развесовка идет

Ilya
28.06.2017
08:34:57

Dmitry
28.06.2017
08:35:10
def wf_avg(self, window, *args, **kwargs):
"""
Returns window average
:param window:
:return:
"""
return float(sum(w[1] for w in window)) / len(window)
вот так оконные функции делаются
там список из (время, значение)
@aversant тестит сейчас
у нас на этот фунционал будет SLA завязан, так что предложения приветсвуются

Ilya
28.06.2017
08:37:32
У нас сегодня на одном PE CEF кончился, пошёл process switching (ip input cpu сожрал). По графикам оказывается проблема началась уже давно, но до аварии никто не замечал
Как раз пригодилось бы