
Snake
17.05.2016
12:58:14
Короче нифига. Поменял, задеплоил. запустил дискавери. Хрен там - в логах тишина, в SA->Monitor->Pools пусто, в Scripts тоже

Ilya
17.05.2016
12:58:28
@dvolodin что логично, для системы это просто данные и она их заводит под новым событием с новым ID

Алексей
17.05.2016
12:58:28
в угоду мониторингу через телеграф

Google

Snake
17.05.2016
12:58:56
хзех
хорошо, а как понять, нок ваще живой?

Алексей
17.05.2016
12:59:24
я смотрю на мониторинг в телеграфе

Ilya
17.05.2016
12:59:35

Snake
17.05.2016
12:59:52
мои слова, птица! (с)

Алексей
17.05.2016
13:00:14
берешь графану. настравливаешь ее на инфлукс. на базу телеграф

Dmitry
17.05.2016
13:00:19
события точно разные?

Алексей
17.05.2016
13:00:29
и видишь там 100500 данных для графиков

Ilya
17.05.2016
13:00:36
попродробнее можно?
Есть 2 лог коллектора, несколько железок для теста шлют на оба коллектора логи, события дублируются.
Событие одно и то же, ID Разный

Алексей
17.05.2016
13:01:01
эм

Ilya
17.05.2016
13:01:02
573b15d4cc044b2f65acb51c
573b15d4cc044b2f65acb51c

Алексей
17.05.2016
13:01:14
а как это должно работь ?

Google

Ilya
17.05.2016
13:01:17

Snake
17.05.2016
13:01:42

Алексей
17.05.2016
13:01:55
с Ильей

Ilya
17.05.2016
13:02:03
Сейча скрин кину, мисмач копипаст

Dmitry
17.05.2016
13:02:25
так, народ, кто там пишет документацию. присылайте мне ссылки. буду править основную

Andrey
17.05.2016
13:02:56
Dmitry ссылки на то, что написали?
@somovis а что делает одно и то же событие на разных коллекторах?

Ilya
17.05.2016
13:04:23
а как это должно работь ?
Ды понятно, что для системы это разные события, но может их в очередь совать как-то, что если одно и тоже событие приходит на кол-во коллекторов, то не дублировать

Dmitry
17.05.2016
13:04:45
так дело не в коллекторах, а в настройках логгирования
сам же сказал - писать туда и туда

Ilya
17.05.2016
13:05:05
Ну да

Andrey
17.05.2016
13:05:08
вопрос в том, как понять, что это одно и то же событие.

Ilya
17.05.2016
13:05:24

Andrey
17.05.2016
13:05:34
не считать же хэш от полей

Ilya
17.05.2016
13:05:36
Поэтому 2 коллектора

Andrey
17.05.2016
13:06:12
обычно, в системах мониторинга делают такую штуку - дедупликацию
берут несколько полей и склеивают их

Алексей
17.05.2016
13:06:35

Andrey
17.05.2016
13:06:40
например IP | интерфейс | ....
и если они совпадают у событий, то просто увеличивают счётчик на событии

Google

Алексей
17.05.2016
13:07:01
а не плавающий ip нет ?

Andrey
17.05.2016
13:07:14
ну) это одна из проблем такого подхода

Ilya
17.05.2016
13:07:15

Алексей
17.05.2016
13:07:38
хочу сказать что можно стрелять себе в ногу множеством способов. и это не самый прияный

Andrey
17.05.2016
13:08:06
в общем, лучше проблему потерявшихся событий решать не ноком
а другими способами
например делать выносные syslog серверы и балансировать их
я делал rsyslog - он умеет делать буфер
и сохранять там события, при потере связи

Ilya
17.05.2016
13:09:40
Ну а как тогда событие попадет в нок, если допустим площадка с коллектором ушла в оффлайн?

Andrey
17.05.2016
13:09:57
необходим резервный канал

Илья
17.05.2016
13:10:07

Ilya
17.05.2016
13:10:20

Алексей
17.05.2016
13:10:20

Ilya
17.05.2016
13:10:23
Железка сдохла
по питанию бордер упал
вариантов много
Ну сеть пока сойдется через резерв

Илья
17.05.2016
13:10:53
tckb ecgttn
если успеет

Google

Алексей
17.05.2016
13:11:01
какой такой резолв ?

Илья
17.05.2016
13:11:46
да это я о своем подумал

Алексей
17.05.2016
13:11:54
а. ок.

Илья
17.05.2016
13:11:56
но вообще в его идее что-то есть
виртуалка с активатором/коллектором может сдохнуть?

Алексей
17.05.2016
13:12:22
Есть, точно есть.

Илья
17.05.2016
13:12:25
может как и все другое

Алексей
17.05.2016
13:12:26
вопрос где он это берет ?
@somovis а можно рисунок от руки как можно два разных потока приходящие по разным маршрутам с разными таймингами и потенциально разными сорсами дедублицировать, при этом не проебывать действительно разные события ?

Ilya
17.05.2016
13:14:22
Нет идей

Dmitry
17.05.2016
13:14:31
NOC умеет дедупликацию

Ilya
17.05.2016
13:14:41
@dvolodin расскажи

Илья
17.05.2016
13:14:45
слишком садистскую

Алексей
17.05.2016
13:15:08
нет. идея с хешем выглядит интересной.
только что включать в хеш

Илья
17.05.2016
13:15:32
половина аварий на старой работе не закрывалось потому что нок дедуплицирует новые сообщения и дропает их

Andrey
17.05.2016
13:15:40
интересной, но сколько же на неё ресурсов надо

Алексей
17.05.2016
13:15:44
вот допустим прилетел тебе "10:23 Fan down"

Victor
17.05.2016
13:16:35

Google

Алексей
17.05.2016
13:16:54
Виктор, спасибо, только две железяки.
разные

Ilya
17.05.2016
13:17:20
?

Victor
17.05.2016
13:17:24
Не берите этот рисунок всерьез
не удержался просто

Алексей
17.05.2016
13:17:36
:)

Илья
17.05.2016
13:18:23
а вообще
может привязаться к таймстампу в сислоге? как вариант

Алексей
17.05.2016
13:18:55
а почему он будет идентичным ?

Andrey
17.05.2016
13:19:06
не... это очень плохой вариант.
Он такой разный бывает особенно когда железка только включилась

Илья
17.05.2016
13:19:15
у двух сообщений с одной железки на разные коллекторы?

Алексей
17.05.2016
13:19:19
да

Andrey
17.05.2016
13:19:23
хотя.... если события с одной железки!
это вариант

Ilya
17.05.2016
13:19:31
Может делать чек ноды?

Илья
17.05.2016
13:19:31
потому что железка таймстампит
почему они разными должны быть
это две копии отправленные в разные дестинейшены

Алексей
17.05.2016
13:20:15
ну тоесть что заставит железяку
1. таймстампить до миллисекунд
2. присаваивать таймстамп при генерации сообщения, а не при его отправке