@metrics_ru

Страница 32 из 681
Semyon
12.09.2016
19:35:05
Абсолютно бесполезная информация, но я отчего-то сильно смеялся

Мой начальник искренне читает Grafana как Графаня

Алексей
12.09.2016
19:37:14
я всяко ее ужы слышал

и граф и графин и графиня

Google
Semyon
12.09.2016
19:38:30
Но Графаня же...

Алексей
12.09.2016
19:39:36
тот нафаня же :)

Semyon
12.09.2016
19:39:54
ну ведь близко же

а этот ещё и график CPU держит в руках явно

Алексей
12.09.2016
19:40:36
это да. похоже ?)

Dmitriy
14.09.2016
06:38:46
Pagerduty
вы используете? дай фидбэк о них?

почему не виктора или опсджини?

ptchol
14.09.2016
06:40:34
Витёк прикольный но перед тем как первый раз открыть лучше налить себе стакан чего нить покрепче

Dmitriy
14.09.2016
06:52:28
я по большей части хочу удобный агрегатор событий на один даш

если оно ещё иногда будет звонить - тоже хорошо

и чтобы саппорт для типа события прям в даше видел инструкцию, как это чинить

ptchol
14.09.2016
07:01:37
Так пацаны из этси вроде что то такое пилили

Ivan
14.09.2016
07:02:48
вы используете? дай фидбэк о них?
Используем, мне нравится. Просто апи и эскалация норм работает

Google
Dmitriy
14.09.2016
07:17:44
Так пацаны из этси вроде что то такое пилили
ты наверное про https://github.com/etsy/opsweekly

я не хочу самостоятельно со всем этим работать, хочу дать денег - и чтобы оно само

Vladimir
14.09.2016
07:18:39
вы используете? дай фидбэк о них?
Используем. Работает. Есть некоторые особенности когда добавляет новых людей в расписание, то все старое тоже сдвигается. И нельзя давать едит доступ всем

ptchol
14.09.2016
07:18:39
да точно, я про это.

Vladimir
14.09.2016
07:18:54
Иначе народ постоянно будет твориться какую то фигню

Dmitriy
14.09.2016
07:19:16
Вы выбирали между системами или сразу пд взяли?

Alexander
14.09.2016
07:19:55
интересный вопрос, а чем мониторить esxi?

кто что юзает?

Vladimir
14.09.2016
07:20:20
Вы выбирали между системами или сразу пд взяли?
Вроде выбирали, но я не участвовал в выборах.

Ivan
14.09.2016
07:21:14
проблем нет?
Пока не было

Vladimir
14.09.2016
07:21:45
Первое время люди с доступом только на оверрайды могли меняться с другими чуваками днями и это вызывало перестроение расписания. Но быстро поправили

Руководству цена не нравится еще :)

Maxim
14.09.2016
07:22:11
у pd чудовищный веб-интерфейс (ну или это я просто ниасилил)

с другой стороны, у меня pd только в групоне, там чертова тыща правил эскалации и прочего говна

пока найдешь, чего тебе надо...

Vladimir
14.09.2016
07:25:49
У нас относительно просто

Есть команды по сервисам, там основной и дополнительный дежурный. И глобальные основной и доп

ptchol
14.09.2016
13:09:47
@all а подскажите, у кго есть опыт что лучше intel 535 или samsung 850pro (не evo)

Google
ptchol
14.09.2016
13:13:39
@Civiloid Володя )) ^

Anton
15.09.2016
09:59:10
гайс, а расскажите как можно организовать такую штуку: мониторить по процессам, кто сколько vmin/vmout, io, cpu, net юзает, автоматически это всё дело пихать в тсдб, а потом как это всё строить. Эдакий автоматический дискавери топ5 процессов в системе. таск немного упоротый, потому что если ты не знаешь что у тебя на системе это делает, то что-то ты делаешь не так, но чтобы не якшаться с тегированием всего и вся и запилить какой-то автоматический аспект для этого.

Semyon
15.09.2016
10:05:07
из похожего, riemann-health дефолтный когда CPU снимает засовывает топ процессов в description эвента

можно так же накостылить

снимай метрику и в десприпшн херачь топ

Magistr
15.09.2016
10:07:57
а зачем тебе такая точность мониторинга ? такое имеет смысл при дебаге, и там понятно есть оверхед

Алексей
15.09.2016
10:11:15
у telegraf есть procmon

скидывай всё в инфлюкс строй топ 5

ptchol
15.09.2016
10:13:19
а зачем тебе такая точность мониторинга ? такое имеет смысл при дебаге, и там понятно есть оверхед
это имеет смысл когда у тебя на тачке крутится 30 с хуем процессов и все они как то шедулятся но иногда кто то кго то выталкивает

и не всегда есть четкое понимание юзадж чего у кого взлетел

Anton
15.09.2016
10:15:02
а зачем тебе такая точность мониторинга ? такое имеет смысл при дебаге, и там понятно есть оверхед
манагеры хочу видеть топ ио процессов на кой буй смотреть на то что постгря на дб сервере в несколько тредов херачит, я честно хз, но хотят потом есть странный свет в конце тунеля, сделать из этого anomalies detection какой-то

типа если на дб сервере херачил там редис и постгря в диск, а потом опаче лог стал писаться как бешенный, то надо в рынду бить

у telegraf есть procmon
кул, как вариант

калит что инфлюкс прокинули всех и теперь ХА искаропки только за баблосек

Алексей
15.09.2016
10:16:41
слово калит от слова кал ?

котому что инфлюкс именно оно

Nick
15.09.2016
10:21:46
кстати о точности - есть какой-нибудь патч или модуль к пхп, чтобы снимать cpu usage юзерский на каждый запрос?

Алексей
15.09.2016
10:22:23
а пинба не то ?

Nick
15.09.2016
10:23:57
точно, спасибо. Стояла же она у нас в туду и забыл про нее

Google
Nick
15.09.2016
10:25:15
а для питона, который запускается через mod_wsgi?

Anton
15.09.2016
11:13:43
слово калит от слова кал ?
ты всё правильно понял :)

Alexander
16.09.2016
08:12:21
кто нибудь уже корреляцию событий в новом заббиксе настроил? как оно ?

Dmitry
16.09.2016
13:42:33
кстати, вот если с 2.х обновляться, то больно?

очень хочется ручного разрешения алертов

Alexander
16.09.2016
13:42:55
c 2 на 3?

Dmitry
16.09.2016
13:42:57
угу

Alexander
16.09.2016
13:43:05
мы ансиблем все хосты обновили вроде ок

Alexander
16.09.2016
13:43:27
совместимость ок

на и агенты тоже ансиблем, там еще проще

серверная часть таб базу перехерачивает

Dmitry
16.09.2016
13:43:54
ну агенты то понятно

а прокси?

хотя у меня проксей нету

Alexander
16.09.2016
13:44:06
не юзаем

Fduch
16.09.2016
14:39:02
Пркси поднимали для тестов:) не понравилось. В нашей архитектуре не надо.

Paul
16.09.2016
15:43:05
а прокси?
надо чистить базу, нельзя ее мигрировать

но вообще у меня есть подопытный заббикс, проблем не было

Dmitry
19.09.2016
11:39:57
https://www.youtube.com/watch?v=vXultLkcPcE

Google
Dmitry
19.09.2016
11:40:07
вот вам про мониторинг мускулей

если кому интересно

да простят меня в перконе

Semyon
20.09.2016
05:49:43
Котаны, а подскажите. Кто-нибудь уже костылил LDAP авторизацию для Алерты?

Алексей
20.09.2016
05:53:10
Я так понимаю её там надо писать а не костылить

Semyon
20.09.2016
05:54:18
Вроде можно закостылить через OAuth адаптер для ldap

но чот выглядит жутко

Алексей
20.09.2016
06:01:01
А ты придумал зачем тебе это?

Semyon
20.09.2016
06:01:55
У меня вроде как вся авторизация идёт через LDAP во всех сервисах совсем

Мне надо как-то людям доступ до Алерты давать

было бы мило делать это так же как и везде

Denis 災 nobody
20.09.2016
06:08:49
К лдапу радиус.. И им

Vladimir
20.09.2016
06:56:30
Мне надо как-то людям доступ до Алерты давать
У nginx есть Pam модуль. Если это веб морда, то можешь nginx заюзать

Алексей
20.09.2016
07:00:22
там кастомный nginx вроде нужнен

ptchol
20.09.2016
07:08:28
мож его собрали как динамический )

Страница 32 из 681