@metrics_ru

Страница 675 из 681

Roman

19.10.2018
20:59:17

вместо того чтобы сказать "в пизду этот ваш карбон, я пойду и напишу свою TSDB для нашей команды" Рома и ко нахуярили го-карбон, а потом протолкали его в остальные команды.

только потому что у меня был “свой” графит. пока мы использовали централизованный графит это было невозможно

Sergey

19.10.2018
20:59:36

только потому что у меня был “свой” графит. пока мы использовали централизованный графит это было невозможно

но графит остался графитом. и ваш графит даже мы использовать начали в определенный момент.

Roman

19.10.2018
21:01:06

это именно как раз пример того что в одной команде создали альтернативное решение. и оно эволюционно победило остальные

(а потом еще раз создали и теперь всех побеждает графит на КХ) ?

Google

Sergey

19.10.2018
21:02:00

(а потом еще раз создали и теперь всех побеждает графит на КХ) ?

и это все еще графит. и когда кому-то нужно напихать куда-то точки - оно уже есть и им уже можно пользоваться.

но кроме одного графита я знаю штуки четыре инсталляции OpenTSDB, например. слабо поддерживаемые, никому не нужные, на полудохлом железе, постоянно ломающиеся (времени-то даже на их администрирование нет).

(возможно их уже нет, я давно не там, увы)

Roman

19.10.2018
21:14:56

ну т.е. переписывание чего-то с нуля не является “повторением одной и ту же работы на разные лады” если сохраняется протокол?

Andor

19.10.2018
21:15:34

ещё и на другом языке

Roman

19.10.2018
21:15:56

который до этого в компании вообще никто не использовал

Sergey

19.10.2018
21:23:46

ну т.е. переписывание чего-то с нуля не является “повторением одной и ту же работы на разные лады” если сохраняется протокол?

не. ты описываешь итерационное развитие проекта. повторением одной и той же работы является, когда каждая команда (все в той же компании) имеет свой тулинг провижионинга машин. каждая команда при этом делает какой-то полуработающий (или более-менее работающий велосипед), но ни у одной команды нет ни технический, ни административной возможности сделать универсальное решение, позволяющее сэкономить всем остальным усилия. еще более жестким вариантом этой чумы является принципиальный NIH-синдром, распространяющийся не только на продукты, созданные снаружи компании, но и снаружи команды. появляются свои мониторинги, свои алертеры, свои автохилеры железа (не софта!), свои системы конфигураций, распределения прав доступа, распределенного консенсуса, мапредьюсов, стораджей, билд-процессов, деплой-процессов и т.д. разница с предыдущим (который из-за убогости и неприменимости альтернатив) в том, что это происходит из желания поиграть с чем-то интересным и фундаментальным. хуже того, я знаю примеры, когда в разных проектах, которыми парт-таймом занимается одна команда (в силу некоторой их схожести) умудрились написать несколько разных стораджей для картинок. в каждое из этих кое-как работающих решений было вложено больше сил, чем изначально планировалось (потому что иначе нельзя), но значительно меньше, чем нужно для того, чтобы решение стало взрослым и применимым хотя бы в другой команде. это боль. вместо того, чтобы отдельные команды занимались выделяемыми важными вещами и делали их офигенно, очень часто получается что небольшие команды занимаются сразу всем в той мере, в которой могут. и вроде бы в компании 50 команд, но такое ощущение, что это федерация 50 компаний с общим собственником.

Sergey

20.10.2018
10:21:11

Вот как важно чтобы был архитектор Матрицы :) всем ку в чатике.

Alexander

20.10.2018
11:23:39

Да уж как то писсиместично

Никита

20.10.2018
12:10:24

не. ты описываешь итерационное развитие проекта. повторением одной и той же работы является, когда каждая команда (все в той же компании) имеет свой тулинг провижионинга машин. каждая команда при этом делает какой-то полуработающий (или более-менее работающий велосипед), но ни у одной команды нет ни технический, ни административной возможности сделать универсальное решение, позволяющее сэкономить всем остальным усилия. еще более жестким вариантом этой чумы является принципиальный NIH-синдром, распространяющийся не только на продукты, созданные снаружи компании, но и снаружи команды. появляются свои мониторинги, свои алертеры, свои автохилеры железа (не софта!), свои системы конфигураций, распределения прав доступа, распределенного консенсуса, мапредьюсов, стораджей, билд-процессов, деплой-процессов и т.д. разница с предыдущим (который из-за убогости и неприменимости альтернатив) в том, что это происходит из желания поиграть с чем-то интересным и фундаментальным. хуже того, я знаю примеры, когда в разных проектах, которыми парт-таймом занимается одна команда (в силу некоторой их схожести) умудрились написать несколько разных стораджей для картинок. в каждое из этих кое-как работающих решений было вложено больше сил, чем изначально планировалось (потому что иначе нельзя), но значительно меньше, чем нужно для того, чтобы решение стало взрослым и применимым хотя бы в другой команде. это боль. вместо того, чтобы отдельные команды занимались выделяемыми важными вещами и делали их офигенно, очень часто получается что небольшие команды занимаются сразу всем в той мере, в которой могут. и вроде бы в компании 50 команд, но такое ощущение, что это федерация 50 компаний с общим собственником.

Есть и другая крайность, когда на большую контору есть Мониторинг, там, Хранилище Картинок, Система Деплоя, и другие неподъёмные глыбы, в которые впилить что-то внезапно понадобившееся какой-то команде ооочень долго и сложно.

Sergey

20.10.2018
12:19:35

конечно, поэтому когда хочется хранилище картинок с перламутровыми пуговицами, нужно новое хранилище.

Никита

20.10.2018
12:22:18

конечно, поэтому когда хочется хранилище картинок с перламутровыми пуговицами, нужно новое хранилище.

А не приведёт ли это к тому, что через некоторое время хранилищ будет штук пять разных?

Sergey

20.10.2018
12:22:27

А не приведёт ли это к тому, что через некоторое время хранилищ будет штук пять разных?

точно!

Google

Sergey

20.10.2018
12:22:39

выше, если что, был сарказм.

Никита

20.10.2018
12:24:26

А, ну да)

Ну то есть решение в том, чтобы внутри компании строить своё подобие амазона?

Vladimir

20.10.2018
13:37:26

Ну то есть решение в том, чтобы внутри компании строить своё подобие амазона?

некоторые запреты в используемых вещах (и подходах) помогают развитию компании и технологий в целом. Если что-то понадобилось одной команде - как-нибудь делайте на текущем, а хотелку в команду занимающуюся сервисом, пусть со временем сделают правильно.

Денис

20.10.2018
13:46:52

Да, ограничения иногда весьма позитивны

Roman

21.10.2018
17:49:37

не. ты описываешь итерационное развитие проекта. повторением одной и той же работы является, когда каждая команда (все в той же компании) имеет свой тулинг провижионинга машин. каждая команда при этом делает какой-то полуработающий (или более-менее работающий велосипед), но ни у одной команды нет ни технический, ни административной возможности сделать универсальное решение, позволяющее сэкономить всем остальным усилия. еще более жестким вариантом этой чумы является принципиальный NIH-синдром, распространяющийся не только на продукты, созданные снаружи компании, но и снаружи команды. появляются свои мониторинги, свои алертеры, свои автохилеры железа (не софта!), свои системы конфигураций, распределения прав доступа, распределенного консенсуса, мапредьюсов, стораджей, билд-процессов, деплой-процессов и т.д. разница с предыдущим (который из-за убогости и неприменимости альтернатив) в том, что это происходит из желания поиграть с чем-то интересным и фундаментальным. хуже того, я знаю примеры, когда в разных проектах, которыми парт-таймом занимается одна команда (в силу некоторой их схожести) умудрились написать несколько разных стораджей для картинок. в каждое из этих кое-как работающих решений было вложено больше сил, чем изначально планировалось (потому что иначе нельзя), но значительно меньше, чем нужно для того, чтобы решение стало взрослым и применимым хотя бы в другой команде. это боль. вместо того, чтобы отдельные команды занимались выделяемыми важными вещами и делали их офигенно, очень часто получается что небольшие команды занимаются сразу всем в той мере, в которой могут. и вроде бы в компании 50 команд, но такое ощущение, что это федерация 50 компаний с общим собственником.

Принцип Конвея и все. Ты не можешь сделать никакой проект, который не повторяет структуру компани

Sergey

21.10.2018
17:49:48

Принцип Конвея и все. Ты не можешь сделать никакой проект, который не повторяет структуру компани

that's true

Roman

21.10.2018
17:52:24

В одной книге посвященной микросервисам писали об универсальной либе для микросервисов. Ну вот это желание - сделать какие то общие тулзы, принципы и т.д. И вот там было прямо сказано, что если команды разные принципиально, то надо даже эту общую библиотеку форкать и копипейстить

Terminator

22.10.2018
09:11:15

@researcher_kot будет жить. Поприветствуем!

Alexey

22.10.2018
09:53:34

привет всем, можете подсказать, пытаюсь настроить дашбоард, чтобы графана показывала доступны хосты или нет, можно как то по типу таблицы сделать, скажем таргеты полученные от прометея сложить в таблицу, и рядом показать значение UP или DOWN, и соответствующий цвет чтобы на одном дашбоарде были все хосты в виде таблицы?

evix

22.10.2018
09:57:05

можно. таблицу по up

Psy

22.10.2018
10:04:51

привет всем, можете подсказать, пытаюсь настроить дашбоард, чтобы графана показывала доступны хосты или нет, можно как то по типу таблицы сделать, скажем таргеты полученные от прометея сложить в таблицу, и рядом показать значение UP или DOWN, и соответствующий цвет чтобы на одном дашбоарде были все хосты в виде таблицы?

У себя так и сделал. Сгенерил табличку по таргетам

Andor

22.10.2018
10:06:20

привет всем, можете подсказать, пытаюсь настроить дашбоард, чтобы графана показывала доступны хосты или нет, можно как то по типу таблицы сделать, скажем таргеты полученные от прометея сложить в таблицу, и рядом показать значение UP или DOWN, и соответствующий цвет чтобы на одном дашбоарде были все хосты в виде таблицы?

Можно

Alexey

22.10.2018
10:06:46

спасибо всем, пошёл курить дальше гугл

а можете подсказать какой гуйд, как правильно в графане запрос писать в query, а то туплю как его писать

Bogdan (SirEdvin)

22.10.2018
10:09:15

Запросы в графане это запросы прома

Alexey

22.10.2018
10:12:01

спасибо, тогда пойду доку прома почитаю ещё раз, а то видимо невнимательно читал

Psy

22.10.2018
10:34:23

а можете подсказать какой гуйд, как правильно в графане запрос писать в query, а то туплю как его писать

probe_success{job="your job"} в табличку выведет всё что есть

column styles останется только подкрутить

Alexey

22.10.2018
10:37:20

спасибо

Google

Psy

22.10.2018
10:38:29

где probe_success - имя метрики, соответственно

Terminator

22.10.2018
10:55:14

@Timofmax будет жить. Поприветствуем!

Timofey

22.10.2018
12:48:43

всем привет, а где меня приветствия ?

bebebe

22.10.2018
12:50:41

всем привет, а где меня приветствия ?

приветик)))))))) какими судьбами?)))))))))

Timofey

22.10.2018
12:53:28

мужчины, у меня диллема, с промом никогда не тыкался, только с забиксом. На сколько целесообразно им мониторить сетевую инфраструктуру, сами железки, тунели?

им *промом

Andor

22.10.2018
12:53:46

ты всегда можешь попробовать

Timofey

22.10.2018
12:54:24

это точно, очень интересен он, уже читаю параллельно. интересует бест практис

просто кругом про пром и как круто он сервисы мониторит

я аж в растерянности

Andor

22.10.2018
12:54:45

ну я на прошлой работе делал снятие метрик по SNMP и пинговалку

bebebe

22.10.2018
12:55:12

ну я на прошлой работе делал снятие метрик по SNMP и пинговалку

аяаяаяаяй

Andor

22.10.2018
12:55:15

для SNMP прометей не очень

но там проблема скорее в SNMP, чем в прометее

Timofey

22.10.2018
12:55:29

для SNMP прометей не очень

а что будет не очень? ?

Andor

22.10.2018
12:55:36

ну и карту не так чтобы удобно строить

Konstantin

22.10.2018
12:55:41

а что будет не очень? ?

ответившего забанят

Timofey

22.10.2018
12:55:57

шутка местная штоле

Andor

22.10.2018
12:56:15

а что будет не очень? ?

ну тут в чяте есть разработчики специальной штуки для мониторинга сетевых железок

Admin

ERROR: S client not available

Google

Andor

22.10.2018
12:56:22

название забыл опять

noc project вроде

Konstantin

22.10.2018
12:56:34

шутка местная штоле

чо шутка-то, ты правила в описании канала читал, прежде чем заджойниться?

bebebe

22.10.2018
12:56:39

мужчины, у меня диллема, с промом никогда не тыкался, только с забиксом. На сколько целесообразно им мониторить сетевую инфраструктуру, сами железки, тунели?

мониторить и снимать метрики - это несколько разных задач. мониторить можно и заббиксом.

Timofey

22.10.2018
12:58:27

мониторить и снимать метрики - это несколько разных задач. мониторить можно и заббиксом.

смотреть на загрузку тунеля это мониторинг или снятие метрики?

Andor

22.10.2018
12:58:45

да

Timofey

22.10.2018
12:58:54

что да)

bebebe

22.10.2018
12:59:57

смотреть на загрузку тунеля это мониторинг или снятие метрики?

смотреть загрузку туннеля - это сбор метрик состояние туннеля - мониторинг

Andor

22.10.2018
13:00:16

состояние тоже можно считать метрикой

Timofey

22.10.2018
13:00:43

а доступность по пингу - мониторинг строго)

Andor

22.10.2018
13:01:16

доступность есть - 1, доступности нет - 0

bebebe

22.10.2018
13:01:20

состояние тоже можно считать метрикой

да, вполне, или результатом проверок нескольких метрик за предыдущие 5 минут

Тимон ставь cacti и оставь zabbix))))))))))))) все будет чикипуки

если железок не много, то cacti даже будет успевать

Алексей

22.10.2018
13:01:55

мужчины, у меня диллема, с промом никогда не тыкался, только с забиксом. На сколько целесообразно им мониторить сетевую инфраструктуру, сами железки, тунели?

Совсем грустно. Лучше возьми Nocproject

Timofey

22.10.2018
13:02:09

каким будет ваш совет по выбору системы для мониторинга сети, задачи тривиальны, доступность железок и снятие с них показаний по состоянию аплинков, памяти, цпу

bebebe

22.10.2018
13:02:38

каким будет ваш совет по выбору системы для мониторинга сети, задачи тривиальны, доступность железок и снятие с них показаний по состоянию аплинков, памяти, цпу

зависит от количества объектов в мониторинге.

Paul