@metrics_ru

Страница 675 из 681
Roman
19.10.2018
20:59:17
Sergey
19.10.2018
20:59:36
только потому что у меня был “свой” графит. пока мы использовали централизованный графит это было невозможно
но графит остался графитом. и ваш графит даже мы использовать начали в определенный момент.

Roman
19.10.2018
21:01:06
это именно как раз пример того что в одной команде создали альтернативное решение. и оно эволюционно победило остальные

(а потом еще раз создали и теперь всех побеждает графит на КХ) ?

Google
Sergey
19.10.2018
21:02:00
(а потом еще раз создали и теперь всех побеждает графит на КХ) ?
и это все еще графит. и когда кому-то нужно напихать куда-то точки - оно уже есть и им уже можно пользоваться.

но кроме одного графита я знаю штуки четыре инсталляции OpenTSDB, например. слабо поддерживаемые, никому не нужные, на полудохлом железе, постоянно ломающиеся (времени-то даже на их администрирование нет).

(возможно их уже нет, я давно не там, увы)

Roman
19.10.2018
21:14:56
ну т.е. переписывание чего-то с нуля не является “повторением одной и ту же работы на разные лады” если сохраняется протокол?

Andor
19.10.2018
21:15:34
ещё и на другом языке

Roman
19.10.2018
21:15:56
который до этого в компании вообще никто не использовал

Sergey
19.10.2018
21:23:46
ну т.е. переписывание чего-то с нуля не является “повторением одной и ту же работы на разные лады” если сохраняется протокол?
не. ты описываешь итерационное развитие проекта. повторением одной и той же работы является, когда каждая команда (все в той же компании) имеет свой тулинг провижионинга машин. каждая команда при этом делает какой-то полуработающий (или более-менее работающий велосипед), но ни у одной команды нет ни технический, ни административной возможности сделать универсальное решение, позволяющее сэкономить всем остальным усилия. еще более жестким вариантом этой чумы является принципиальный NIH-синдром, распространяющийся не только на продукты, созданные снаружи компании, но и снаружи команды. появляются свои мониторинги, свои алертеры, свои автохилеры железа (не софта!), свои системы конфигураций, распределения прав доступа, распределенного консенсуса, мапредьюсов, стораджей, билд-процессов, деплой-процессов и т.д. разница с предыдущим (который из-за убогости и неприменимости альтернатив) в том, что это происходит из желания поиграть с чем-то интересным и фундаментальным. хуже того, я знаю примеры, когда в разных проектах, которыми парт-таймом занимается одна команда (в силу некоторой их схожести) умудрились написать несколько разных стораджей для картинок. в каждое из этих кое-как работающих решений было вложено больше сил, чем изначально планировалось (потому что иначе нельзя), но значительно меньше, чем нужно для того, чтобы решение стало взрослым и применимым хотя бы в другой команде. это боль. вместо того, чтобы отдельные команды занимались выделяемыми важными вещами и делали их офигенно, очень часто получается что небольшие команды занимаются сразу всем в той мере, в которой могут. и вроде бы в компании 50 команд, но такое ощущение, что это федерация 50 компаний с общим собственником.

Sergey
20.10.2018
10:21:11
Вот как важно чтобы был архитектор Матрицы :) всем ку в чатике.

Alexander
20.10.2018
11:23:39
Да уж как то писсиместично

Никита
20.10.2018
12:10:24
не. ты описываешь итерационное развитие проекта. повторением одной и той же работы является, когда каждая команда (все в той же компании) имеет свой тулинг провижионинга машин. каждая команда при этом делает какой-то полуработающий (или более-менее работающий велосипед), но ни у одной команды нет ни технический, ни административной возможности сделать универсальное решение, позволяющее сэкономить всем остальным усилия. еще более жестким вариантом этой чумы является принципиальный NIH-синдром, распространяющийся не только на продукты, созданные снаружи компании, но и снаружи команды. появляются свои мониторинги, свои алертеры, свои автохилеры железа (не софта!), свои системы конфигураций, распределения прав доступа, распределенного консенсуса, мапредьюсов, стораджей, билд-процессов, деплой-процессов и т.д. разница с предыдущим (который из-за убогости и неприменимости альтернатив) в том, что это происходит из желания поиграть с чем-то интересным и фундаментальным. хуже того, я знаю примеры, когда в разных проектах, которыми парт-таймом занимается одна команда (в силу некоторой их схожести) умудрились написать несколько разных стораджей для картинок. в каждое из этих кое-как работающих решений было вложено больше сил, чем изначально планировалось (потому что иначе нельзя), но значительно меньше, чем нужно для того, чтобы решение стало взрослым и применимым хотя бы в другой команде. это боль. вместо того, чтобы отдельные команды занимались выделяемыми важными вещами и делали их офигенно, очень часто получается что небольшие команды занимаются сразу всем в той мере, в которой могут. и вроде бы в компании 50 команд, но такое ощущение, что это федерация 50 компаний с общим собственником.
Есть и другая крайность, когда на большую контору есть Мониторинг, там, Хранилище Картинок, Система Деплоя, и другие неподъёмные глыбы, в которые впилить что-то внезапно понадобившееся какой-то команде ооочень долго и сложно.

Sergey
20.10.2018
12:19:35
конечно, поэтому когда хочется хранилище картинок с перламутровыми пуговицами, нужно новое хранилище.

Никита
20.10.2018
12:22:18
конечно, поэтому когда хочется хранилище картинок с перламутровыми пуговицами, нужно новое хранилище.
А не приведёт ли это к тому, что через некоторое время хранилищ будет штук пять разных?

Google
Sergey
20.10.2018
12:22:39
выше, если что, был сарказм.

Никита
20.10.2018
12:24:26
А, ну да)

Ну то есть решение в том, чтобы внутри компании строить своё подобие амазона?

Vladimir
20.10.2018
13:37:26
Ну то есть решение в том, чтобы внутри компании строить своё подобие амазона?
некоторые запреты в используемых вещах (и подходах) помогают развитию компании и технологий в целом. Если что-то понадобилось одной команде - как-нибудь делайте на текущем, а хотелку в команду занимающуюся сервисом, пусть со временем сделают правильно.

Денис
20.10.2018
13:46:52
Да, ограничения иногда весьма позитивны

Roman
21.10.2018
17:49:37
не. ты описываешь итерационное развитие проекта. повторением одной и той же работы является, когда каждая команда (все в той же компании) имеет свой тулинг провижионинга машин. каждая команда при этом делает какой-то полуработающий (или более-менее работающий велосипед), но ни у одной команды нет ни технический, ни административной возможности сделать универсальное решение, позволяющее сэкономить всем остальным усилия. еще более жестким вариантом этой чумы является принципиальный NIH-синдром, распространяющийся не только на продукты, созданные снаружи компании, но и снаружи команды. появляются свои мониторинги, свои алертеры, свои автохилеры железа (не софта!), свои системы конфигураций, распределения прав доступа, распределенного консенсуса, мапредьюсов, стораджей, билд-процессов, деплой-процессов и т.д. разница с предыдущим (который из-за убогости и неприменимости альтернатив) в том, что это происходит из желания поиграть с чем-то интересным и фундаментальным. хуже того, я знаю примеры, когда в разных проектах, которыми парт-таймом занимается одна команда (в силу некоторой их схожести) умудрились написать несколько разных стораджей для картинок. в каждое из этих кое-как работающих решений было вложено больше сил, чем изначально планировалось (потому что иначе нельзя), но значительно меньше, чем нужно для того, чтобы решение стало взрослым и применимым хотя бы в другой команде. это боль. вместо того, чтобы отдельные команды занимались выделяемыми важными вещами и делали их офигенно, очень часто получается что небольшие команды занимаются сразу всем в той мере, в которой могут. и вроде бы в компании 50 команд, но такое ощущение, что это федерация 50 компаний с общим собственником.
Принцип Конвея и все. Ты не можешь сделать никакой проект, который не повторяет структуру компани

Roman
21.10.2018
17:52:24
В одной книге посвященной микросервисам писали об универсальной либе для микросервисов. Ну вот это желание - сделать какие то общие тулзы, принципы и т.д. И вот там было прямо сказано, что если команды разные принципиально, то надо даже эту общую библиотеку форкать и копипейстить

Terminator
22.10.2018
09:11:15
@researcher_kot будет жить. Поприветствуем!

Alexey
22.10.2018
09:53:34
привет всем, можете подсказать, пытаюсь настроить дашбоард, чтобы графана показывала доступны хосты или нет, можно как то по типу таблицы сделать, скажем таргеты полученные от прометея сложить в таблицу, и рядом показать значение UP или DOWN, и соответствующий цвет чтобы на одном дашбоарде были все хосты в виде таблицы?

evix
22.10.2018
09:57:05
можно. таблицу по up

Alexey
22.10.2018
10:06:46
спасибо всем, пошёл курить дальше гугл

а можете подсказать какой гуйд, как правильно в графане запрос писать в query, а то туплю как его писать

Bogdan (SirEdvin)
22.10.2018
10:09:15
Запросы в графане это запросы прома

Alexey
22.10.2018
10:12:01
спасибо, тогда пойду доку прома почитаю ещё раз, а то видимо невнимательно читал

Psy
22.10.2018
10:34:23
column styles останется только подкрутить

Alexey
22.10.2018
10:37:20
спасибо

Google
Psy
22.10.2018
10:38:29
где probe_success - имя метрики, соответственно

Terminator
22.10.2018
10:55:14
@Timofmax будет жить. Поприветствуем!

Timofey
22.10.2018
12:48:43
всем привет, а где меня приветствия ?

bebebe
22.10.2018
12:50:41
всем привет, а где меня приветствия ?
приветик)))))))) какими судьбами?)))))))))

Timofey
22.10.2018
12:53:28
мужчины, у меня диллема, с промом никогда не тыкался, только с забиксом. На сколько целесообразно им мониторить сетевую инфраструктуру, сами железки, тунели?

им *промом

Andor
22.10.2018
12:53:46
ты всегда можешь попробовать

Timofey
22.10.2018
12:54:24
это точно, очень интересен он, уже читаю параллельно. интересует бест практис

просто кругом про пром и как круто он сервисы мониторит

я аж в растерянности

Andor
22.10.2018
12:54:45
ну я на прошлой работе делал снятие метрик по SNMP и пинговалку

Andor
22.10.2018
12:55:15
для SNMP прометей не очень

но там проблема скорее в SNMP, чем в прометее

Timofey
22.10.2018
12:55:29
для SNMP прометей не очень
а что будет не очень? ?

Andor
22.10.2018
12:55:36
ну и карту не так чтобы удобно строить

Konstantin
22.10.2018
12:55:41
а что будет не очень? ?
ответившего забанят

Timofey
22.10.2018
12:55:57
шутка местная штоле

Andor
22.10.2018
12:56:15
а что будет не очень? ?
ну тут в чяте есть разработчики специальной штуки для мониторинга сетевых железок

название забыл опять

Google
Andor
22.10.2018
12:56:31
noc project вроде

Konstantin
22.10.2018
12:56:34
шутка местная штоле
чо шутка-то, ты правила в описании канала читал, прежде чем заджойниться?

Timofey
22.10.2018
12:58:27
мониторить и снимать метрики - это несколько разных задач. мониторить можно и заббиксом.
смотреть на загрузку тунеля это мониторинг или снятие метрики?

Andor
22.10.2018
12:58:45
да

Timofey
22.10.2018
12:58:54
что да)

bebebe
22.10.2018
12:59:57
смотреть на загрузку тунеля это мониторинг или снятие метрики?
смотреть загрузку туннеля - это сбор метрик состояние туннеля - мониторинг

Andor
22.10.2018
13:00:16
состояние тоже можно считать метрикой

Timofey
22.10.2018
13:00:43
а доступность по пингу - мониторинг строго)

Andor
22.10.2018
13:01:16
доступность есть - 1, доступности нет - 0

bebebe
22.10.2018
13:01:20
состояние тоже можно считать метрикой
да, вполне, или результатом проверок нескольких метрик за предыдущие 5 минут

Тимон ставь cacti и оставь zabbix))))))))))))) все будет чикипуки

если железок не много, то cacti даже будет успевать

Timofey
22.10.2018
13:02:09
каким будет ваш совет по выбору системы для мониторинга сети, задачи тривиальны, доступность железок и снятие с них показаний по состоянию аплинков, памяти, цпу

Andor
22.10.2018
13:04:08
у прометея с инструментами вокруг него не так чтобы хорошо для снятия метрик с сетевых железок

Timofey
22.10.2018
13:04:10
меня привлекает что у прома есть хуки для алертменеджера по уведомленнию в Teams

Google
Andor
22.10.2018
13:04:20
но ты конечно всегда можешь сделать эти инструменты

evix
22.10.2018
13:04:22
мы с cacti съехали на librenms. Зависимость есть

Andor
22.10.2018
13:04:41
кто?

Timofey
22.10.2018
13:04:51
пром

Andor
22.10.2018
13:04:57
прометей поддерживает только один формат метрик - свой собственный

Страница 675 из 681