
Roman
19.10.2018
20:59:17

Sergey
19.10.2018
20:59:36

Roman
19.10.2018
21:01:06
это именно как раз пример того что в одной команде создали альтернативное решение. и оно эволюционно победило остальные
(а потом еще раз создали и теперь всех побеждает графит на КХ) ?

Google

Sergey
19.10.2018
21:02:00
но кроме одного графита я знаю штуки четыре инсталляции OpenTSDB, например. слабо поддерживаемые, никому не нужные, на полудохлом железе, постоянно ломающиеся (времени-то даже на их администрирование нет).
(возможно их уже нет, я давно не там, увы)

Roman
19.10.2018
21:14:56
ну т.е. переписывание чего-то с нуля не является “повторением одной и ту же работы на разные лады” если сохраняется протокол?

Andor
19.10.2018
21:15:34
ещё и на другом языке

Roman
19.10.2018
21:15:56
который до этого в компании вообще никто не использовал


Sergey
19.10.2018
21:23:46
ну т.е. переписывание чего-то с нуля не является “повторением одной и ту же работы на разные лады” если сохраняется протокол?
не. ты описываешь итерационное развитие проекта.
повторением одной и той же работы является, когда каждая команда (все в той же компании) имеет свой тулинг провижионинга машин. каждая команда при этом делает какой-то полуработающий (или более-менее работающий велосипед), но ни у одной команды нет ни технический, ни административной возможности сделать универсальное решение, позволяющее сэкономить всем остальным усилия.
еще более жестким вариантом этой чумы является принципиальный NIH-синдром, распространяющийся не только на продукты, созданные снаружи компании, но и снаружи команды. появляются свои мониторинги, свои алертеры, свои автохилеры железа (не софта!), свои системы конфигураций, распределения прав доступа, распределенного консенсуса, мапредьюсов, стораджей, билд-процессов, деплой-процессов и т.д. разница с предыдущим (который из-за убогости и неприменимости альтернатив) в том, что это происходит из желания поиграть с чем-то интересным и фундаментальным.
хуже того, я знаю примеры, когда в разных проектах, которыми парт-таймом занимается одна команда (в силу некоторой их схожести) умудрились написать несколько разных стораджей для картинок.
в каждое из этих кое-как работающих решений было вложено больше сил, чем изначально планировалось (потому что иначе нельзя), но значительно меньше, чем нужно для того, чтобы решение стало взрослым и применимым хотя бы в другой команде.
это боль. вместо того, чтобы отдельные команды занимались выделяемыми важными вещами и делали их офигенно, очень часто получается что небольшие команды занимаются сразу всем в той мере, в которой могут. и вроде бы в компании 50 команд, но такое ощущение, что это федерация 50 компаний с общим собственником.


Sergey
20.10.2018
10:21:11
Вот как важно чтобы был архитектор Матрицы :) всем ку в чатике.

Alexander
20.10.2018
11:23:39
Да уж как то писсиместично


Никита
20.10.2018
12:10:24
не. ты описываешь итерационное развитие проекта.
повторением одной и той же работы является, когда каждая команда (все в той же компании) имеет свой тулинг провижионинга машин. каждая команда при этом делает какой-то полуработающий (или более-менее работающий велосипед), но ни у одной команды нет ни технический, ни административной возможности сделать универсальное решение, позволяющее сэкономить всем остальным усилия.
еще более жестким вариантом этой чумы является принципиальный NIH-синдром, распространяющийся не только на продукты, созданные снаружи компании, но и снаружи команды. появляются свои мониторинги, свои алертеры, свои автохилеры железа (не софта!), свои системы конфигураций, распределения прав доступа, распределенного консенсуса, мапредьюсов, стораджей, билд-процессов, деплой-процессов и т.д. разница с предыдущим (который из-за убогости и неприменимости альтернатив) в том, что это происходит из желания поиграть с чем-то интересным и фундаментальным.
хуже того, я знаю примеры, когда в разных проектах, которыми парт-таймом занимается одна команда (в силу некоторой их схожести) умудрились написать несколько разных стораджей для картинок.
в каждое из этих кое-как работающих решений было вложено больше сил, чем изначально планировалось (потому что иначе нельзя), но значительно меньше, чем нужно для того, чтобы решение стало взрослым и применимым хотя бы в другой команде.
это боль. вместо того, чтобы отдельные команды занимались выделяемыми важными вещами и делали их офигенно, очень часто получается что небольшие команды занимаются сразу всем в той мере, в которой могут. и вроде бы в компании 50 команд, но такое ощущение, что это федерация 50 компаний с общим собственником.
Есть и другая крайность, когда на большую контору есть Мониторинг, там, Хранилище Картинок, Система Деплоя, и другие неподъёмные глыбы, в которые впилить что-то внезапно понадобившееся какой-то команде ооочень долго и сложно.


Sergey
20.10.2018
12:19:35
конечно, поэтому когда хочется хранилище картинок с перламутровыми пуговицами, нужно новое хранилище.

Никита
20.10.2018
12:22:18

Sergey
20.10.2018
12:22:27

Google

Sergey
20.10.2018
12:22:39
выше, если что, был сарказм.

Никита
20.10.2018
12:24:26
А, ну да)
Ну то есть решение в том, чтобы внутри компании строить своё подобие амазона?

Vladimir
20.10.2018
13:37:26

Денис
20.10.2018
13:46:52
Да, ограничения иногда весьма позитивны


Roman
21.10.2018
17:49:37
не. ты описываешь итерационное развитие проекта.
повторением одной и той же работы является, когда каждая команда (все в той же компании) имеет свой тулинг провижионинга машин. каждая команда при этом делает какой-то полуработающий (или более-менее работающий велосипед), но ни у одной команды нет ни технический, ни административной возможности сделать универсальное решение, позволяющее сэкономить всем остальным усилия.
еще более жестким вариантом этой чумы является принципиальный NIH-синдром, распространяющийся не только на продукты, созданные снаружи компании, но и снаружи команды. появляются свои мониторинги, свои алертеры, свои автохилеры железа (не софта!), свои системы конфигураций, распределения прав доступа, распределенного консенсуса, мапредьюсов, стораджей, билд-процессов, деплой-процессов и т.д. разница с предыдущим (который из-за убогости и неприменимости альтернатив) в том, что это происходит из желания поиграть с чем-то интересным и фундаментальным.
хуже того, я знаю примеры, когда в разных проектах, которыми парт-таймом занимается одна команда (в силу некоторой их схожести) умудрились написать несколько разных стораджей для картинок.
в каждое из этих кое-как работающих решений было вложено больше сил, чем изначально планировалось (потому что иначе нельзя), но значительно меньше, чем нужно для того, чтобы решение стало взрослым и применимым хотя бы в другой команде.
это боль. вместо того, чтобы отдельные команды занимались выделяемыми важными вещами и делали их офигенно, очень часто получается что небольшие команды занимаются сразу всем в той мере, в которой могут. и вроде бы в компании 50 команд, но такое ощущение, что это федерация 50 компаний с общим собственником.
Принцип Конвея и все. Ты не можешь сделать никакой проект, который не повторяет структуру компани


Sergey
21.10.2018
17:49:48

Roman
21.10.2018
17:52:24
В одной книге посвященной микросервисам писали об универсальной либе для микросервисов. Ну вот это желание - сделать какие то общие тулзы, принципы и т.д. И вот там было прямо сказано, что если команды разные принципиально, то надо даже эту общую библиотеку форкать и копипейстить

Terminator
22.10.2018
09:11:15
@researcher_kot будет жить. Поприветствуем!

Alexey
22.10.2018
09:53:34
привет всем, можете подсказать, пытаюсь настроить дашбоард, чтобы графана показывала доступны хосты или нет, можно как то по типу таблицы сделать, скажем таргеты полученные от прометея сложить в таблицу, и рядом показать значение UP или DOWN, и соответствующий цвет
чтобы на одном дашбоарде были все хосты в виде таблицы?

evix
22.10.2018
09:57:05
можно. таблицу по up

Psy
22.10.2018
10:04:51

Andor
22.10.2018
10:06:20

Alexey
22.10.2018
10:06:46
спасибо всем, пошёл курить дальше гугл
а можете подсказать какой гуйд, как правильно в графане запрос писать в query, а то туплю как его писать

Bogdan (SirEdvin)
22.10.2018
10:09:15
Запросы в графане это запросы прома

Alexey
22.10.2018
10:12:01
спасибо, тогда пойду доку прома почитаю ещё раз, а то видимо невнимательно читал

Psy
22.10.2018
10:34:23
column styles останется только подкрутить

Alexey
22.10.2018
10:37:20
спасибо

Google

Psy
22.10.2018
10:38:29
где probe_success - имя метрики, соответственно

Terminator
22.10.2018
10:55:14
@Timofmax будет жить. Поприветствуем!

Timofey
22.10.2018
12:48:43
всем привет, а где меня приветствия ?

bebebe
22.10.2018
12:50:41

Timofey
22.10.2018
12:53:28
мужчины, у меня диллема, с промом никогда не тыкался, только с забиксом. На сколько целесообразно им мониторить сетевую инфраструктуру, сами железки, тунели?
им *промом

Andor
22.10.2018
12:53:46
ты всегда можешь попробовать

Timofey
22.10.2018
12:54:24
это точно, очень интересен он, уже читаю параллельно. интересует бест практис
просто кругом про пром и как круто он сервисы мониторит
я аж в растерянности

Andor
22.10.2018
12:54:45
ну я на прошлой работе делал снятие метрик по SNMP и пинговалку

bebebe
22.10.2018
12:55:12

Andor
22.10.2018
12:55:15
для SNMP прометей не очень
но там проблема скорее в SNMP, чем в прометее

Timofey
22.10.2018
12:55:29

Andor
22.10.2018
12:55:36
ну и карту не так чтобы удобно строить

Konstantin
22.10.2018
12:55:41

Timofey
22.10.2018
12:55:57
шутка местная штоле

Andor
22.10.2018
12:56:15
название забыл опять

Google

Andor
22.10.2018
12:56:31
noc project вроде

Konstantin
22.10.2018
12:56:34

bebebe
22.10.2018
12:56:39

Timofey
22.10.2018
12:58:27

Andor
22.10.2018
12:58:45
да

Timofey
22.10.2018
12:58:54
что да)

bebebe
22.10.2018
12:59:57

Andor
22.10.2018
13:00:16
состояние тоже можно считать метрикой

Timofey
22.10.2018
13:00:43
а доступность по пингу - мониторинг строго)

Andor
22.10.2018
13:01:16
доступность есть - 1, доступности нет - 0

bebebe
22.10.2018
13:01:20
Тимон ставь cacti и оставь zabbix))))))))))))) все будет чикипуки
если железок не много, то cacti даже будет успевать

Алексей
22.10.2018
13:01:55

Timofey
22.10.2018
13:02:09
каким будет ваш совет по выбору системы для мониторинга сети, задачи тривиальны, доступность железок и снятие с них показаний по состоянию аплинков, памяти, цпу

bebebe
22.10.2018
13:02:38

Paul
22.10.2018
13:03:42

Andor
22.10.2018
13:04:08
у прометея с инструментами вокруг него не так чтобы хорошо для снятия метрик с сетевых железок

Timofey
22.10.2018
13:04:10
меня привлекает что у прома есть хуки для алертменеджера по уведомленнию в Teams

Google

Andor
22.10.2018
13:04:20
но ты конечно всегда можешь сделать эти инструменты

evix
22.10.2018
13:04:22
мы с cacti съехали на librenms. Зависимость есть

Timofey
22.10.2018
13:04:27

Andor
22.10.2018
13:04:41
кто?

Timofey
22.10.2018
13:04:51
пром

Andor
22.10.2018
13:04:57
прометей поддерживает только один формат метрик - свой собственный