
Evgeny
09.02.2018
12:16:18
спасибо )

Nklya
09.02.2018
12:16:34
О, теперь мы знаем секретные команды бота))

Алексей
09.02.2018
12:24:18
они не очень секретные :)
и доступны админамтока

Google

Vladimir
09.02.2018
12:26:06
А кажется он меня админом не считает :)
Тут

Andrew
09.02.2018
12:28:23
Не заслужил :D
Телеграм сам решает!

Алексей
09.02.2018
12:35:56
/subscribe lomik/carbon-clickhouse all

Vladimir
09.02.2018
12:37:23
Хм
Тут была какая то фигя что он сообщения переставал слушать пока не выгонишь и не добавишь снова
/subscribe lomik/carbon-clickhouse all
Короче я его поправлю как нибудь

Alexander
09.02.2018
13:32:18
Нашел https://uptimerobot.com может кому пригодиться. У нас оповещения приходят в телеграм, как привязать оба сервиса здесь https://torunar.tk/2017/05/15/uptime-telegram.

Andor
09.02.2018
14:27:20
Он совсем простой вроде

Google

Nklya
09.02.2018
18:50:46
Отрывок из книги специально для фанатов Z))
«Anti-Pattern #5: Manual Configuration
I’m sure we all can agree that automation is awesome. That’s why it’s surprising to me how often monitoring configuration is manual. The question I never want to hear is “Can you add this to monitoring?»
Отрывок из книги: Julian, Mike. «Practical Monitoring.» O'Reilly Media, Inc., 2017

Bogdan (SirEdvin)
09.02.2018
21:15:46
Справедливости ради, у систем, которые поддерживают push логику в целом нет такой проблемы. И да, Z умеет в push логику)

Nklya
09.02.2018
21:20:48
Шаблоны он тоже пушем себе добавит для нового сервиса?
Это классическая защита З - у нас есть автодискавери ответ на все
А про то, что нужно не только добавлять хосты как будто не замечают

evix
09.02.2018
21:28:54
в 3.2 хосты и шаблоны добавлялись через апи, но в 3.4 они сломали апи и теперь анзиблом можно только агентов ставить, например

Nklya
09.02.2018
21:29:57
Зато теперь еластик есть, который они считают tsdb ))

evix
09.02.2018
21:32:42
для логов?

Алексей
09.02.2018
21:33:12
нет. tsdb
для метрик you know

evix
09.02.2018
21:33:44
так у них уже есть реляционная бд для метрик

Алексей
09.02.2018
21:33:58
вместе к ней да

evix
09.02.2018
21:34:08
а. как интересно.

Alexander
09.02.2018
21:36:07

evix
09.02.2018
21:36:09
это какая-то проф деформация. только в плохом смысле
от долгого пользования заббиксом что-то отмирает, возможно. у нас, например, есть люди, которые делают cat 10gb file> что-то там чтобы грепом забрать из него 4 числа и отдать заббиксу
а там одно ядро и гиг памяти. и потом приходят заявки на херовую систему виртуализации и просьбу купить им вмварь, например

Алексей
09.02.2018
21:40:01
самого эта собака еще не упарила ?

Nklya
09.02.2018
21:40:25
Это мой вымышленный друг, мне с ним хорошо ))

Алексей
09.02.2018
21:40:34
:)

Google

evix
09.02.2018
21:40:38
такое, конечно, можно провернуть с любым агентом, который умеет читать результаты из файла и отдавать мониторингу

Nklya
09.02.2018
21:41:24
Эти же упоротые товарищи считают нормальным слать логи в заббикс и смотреть как БД распухает нафиг

evix
09.02.2018
21:42:54
и еще они не любят смотреть в slow_queries_log при этом

Alexander
09.02.2018
21:43:31

evix
09.02.2018
21:44:18
конечно деться. можно делать tail, для начала
там не так много сообщений в минуту. можно спокойно делать tail -n50

Алексей
09.02.2018
21:48:56
и снова скажу mtail

Alexandr
09.02.2018
23:42:05

Bogdan (SirEdvin)
10.02.2018
06:49:44

George
10.02.2018
07:35:45
Тогда можно автоматизировать

Bogdan (SirEdvin)
10.02.2018
09:20:27

Sergey
10.02.2018
09:58:11

Nklya
10.02.2018
10:06:58

Pavel
10.02.2018
10:29:31

Nklya
10.02.2018
10:30:21
И кода должны

Bogdan (SirEdvin)
10.02.2018
10:37:32
Алерты для прома, и графики для графаны тоже надо добавлять вручную, если что)

Nklya
10.02.2018
10:40:34
Алерты прома в ямликах, дашборды графана из json умеет тянуть

Pavel
10.02.2018
10:42:14

Nklya
10.02.2018
10:45:05
в 3.2 хосты и шаблоны добавлялись через апи, но в 3.4 они сломали апи и теперь анзиблом можно только агентов ставить, например

Google

Bogdan (SirEdvin)
10.02.2018
10:46:16

Nklya
10.02.2018
10:46:19
Если для графаны есть куча готовых обвязок для этого, то для болезного нужно самому вприсядку наяривать, натыкаясь на разные версии апи и другие интересные места
5 уже бета и вот-вот выйдет, а за это время к Z успели прикрутить эластик только зачем-то.

Admin
ERROR: S client not available

Paul
10.02.2018
10:51:15

Nklya
10.02.2018
10:52:14
Я понимаю кейс и думаю что пора развиваться, а не соревноваться из кого больше песочек сыпется с нагиосом

Bogdan (SirEdvin)
10.02.2018
10:53:54
Я в целом предлагаю свернуть этот разговор, потому что за нами выедут) Алсо, нельзя развиватся, если весь продукт построен на концепциях, которые устарели. Тут только все выкинуть и сделать новый продукт. Ну, мне так кажется)
Пройдет еще 20 лет и prometheus будет как Z или в лучшем случае, нагиос)

Paul
10.02.2018
10:56:40

Bogdan (SirEdvin)
10.02.2018
10:57:35
В идеале, ставишь какой-то агент, а он все собирает, данные хранит, а еще и алерты сам настраивает. Ну и автопочинка из коробки)

Paul
10.02.2018
10:58:36

Bogdan (SirEdvin)
10.02.2018
10:59:41
Ну, ему все равно нужны конфигурации. А вот этой штуке не нужно будет)
Хотя, судя по всему, будем собирать просто БЕЗУМНОЕ количество данных, вплоть до построчного выделения памяти) Потому что сложность растет и как оно все работает уже никто не понимает)

Dno
10.02.2018
12:52:18

Sergey
10.02.2018
17:18:21
вполне может быть что полную диагностику впилят в железо так чтобы не грузить те ресурсы которые должны выполнять полезный код
субботнее пинание макаронного монстра? :)

Paul
10.02.2018
17:36:35

Bogdan (SirEdvin)
10.02.2018
17:44:36
Ну, по построчному выделению памяти можно будет постфактум искать утечки, без профилирования разработчиками.

Vladimir
10.02.2018
18:08:44

Paul
10.02.2018
18:20:24
главный вопрос даже не в том, как их собирать и как хранить (это интересный вопрос тоже, но он – не главный). Главный вопрос – как это все анализировать
ибо данных там будет очень много. И в них очень просто утонуть, это снижает их ценность до нуля

Google

Bogdan (SirEdvin)
10.02.2018
18:24:54
Скорее всего будет как-то так же. Топовые компании или разработчики будут диктовать, что надо собирать, а остальные будут собирать это и учится с ним работать :)
Опять же, возможно я не прав, но мне кажется, что нет никаких проблем в большом количестве данных, если есть понимание, как извлечь нужные.

Vladimir
10.02.2018
18:29:47

Alexander
10.02.2018
20:16:15
Для начала было бы неплохо хотя бы заиметь масштабируемый и отказоустойчивый мониторинг (сбор метрик+алерты по ним) с push-семантикой, который растягивается на несколько дц, умеет давить флапы, имеет продвинутую эскалацию и все это через CLI.
То есть, было бы неплохо иметь, для начала, хорошо исполненный с технической точки зрения мониторинг с базовой функциональностью

Andor
10.02.2018
20:17:19

Bogdan (SirEdvin)
10.02.2018
20:18:40
Касательно push/pull - это похоже на холивар, а остальные вещи я думаю, у крупных компаний свои точно есть.

Vladimir
10.02.2018
20:21:48
И пр

Andor
10.02.2018
20:22:52
а, вы про трейсы обсуждали?

Bogdan (SirEdvin)
10.02.2018
21:42:35
Мы обсуждали как будет выглядеть мониторинг будущего)

Vladimir
10.02.2018
21:55:46
Ну будут вероятно приготовленные срезы с выбором по тегам
И водможностью спуска

Sergey
12.02.2018
10:14:41
@alexanderzobnin привет!
а есть идеи переменную с типом интервал корректно в авторефреш и в кештаймаут прокидывать?

Alexander
12.02.2018
10:40:17