@metrics_ru

Страница 83 из 681
Serge
26.01.2017
13:05:02
CPU в это время на хостах за ELB - ровная линия

естественно - первый кандидат - сетка

но это на стороне заказчика, они спят, попросили их проверить не было ли у них затупов

ну то есть мы сейчас в ситуации, когда "у нас есть охуенные метрики, можно в них смотреть" превратилось в "ну и что ваши охуенные метрики могут сказать про вот этот затуп?"

Google
Serge
26.01.2017
13:14:50
забавно, накопали High CPU на базке;)

Алексей
26.01.2017
13:15:44
дашбордики наверное надо понаделать.

от простого к сложному наверное

Paul
26.01.2017
13:15:54
глубокая мысль

Алексей
26.01.2017
13:16:14
очевидные вариант в первую очередь же

Serge
26.01.2017
13:26:05
ну там есть;) не всё правда, пока хватало

вот еще пару досочек приделали теперь по пути

и алерт на CPU базки вниз подвинули

Антон
26.01.2017
14:25:29
А grafana ещё не умеет выставлять алерты , если в формулах используются переменные для хостов?

lastsky
26.01.2017
14:26:12
alerting не поддерживается с темплейтингом одновременно

в 4.1.1 точно

я наступил на эти грабли - настряпал везде алертинга, а потом попросили срочно впилить темплейтинг :)

Антон
26.01.2017
14:28:12
А ведь должны же сделать в ближайшее время, если сделают можно алертинг на графану повесить )

Google
Антон
26.01.2017
14:35:35
https://github.com/grafana/grafana/issues/6557 no milestone (

Алексей
26.01.2017
14:37:25
гг. подозреваю что этот ишью страшный сон девелопера

lastsky
26.01.2017
14:39:42
это не просто сон, это ж кошмар. вот ты сделал алерт, потом тебе добавилось в метриках хостов всяких, там новые instance.

и че, по каждой instance создать алерт?

Алексей
26.01.2017
14:40:03
ога да.

и ладно только интсанс

там ведь хитрые датасорсы есть

кешировать лукапы в базу ? *кешепроблемы

lastsky
26.01.2017
14:40:52
я увидел что графана ошибку выдала "alerting is not supported with templating" и сразу осознал какое я тупое действие совершил ))))

Алексей
26.01.2017
14:40:58
не кешировать *датабейспроблемы

Anton
31.01.2017
08:41:45
гайс, а кто чем собирает метрики по *процессам* ?

смотрю на телеграф, он у меня аутирует и не меняет циферки, хотя приложение там постоянно разную нагрузку даёт

есть что ещё дельное?

lastsky
31.01.2017
08:49:48
вот у меня тож с телеграфом проблема, скрещивает между собой процессы, показывает космос

Maxim
31.01.2017
09:06:32
@strukov, @lastsky a новый телеграф уже пробовали? который 0.12

там, судя по чейнжлогу, это пофиксили

lastsky
31.01.2017
09:06:56
мм нет. у меня не было релиз нотифая что выкатили 0.12... хмм

Maxim
31.01.2017
09:07:14
да даже я в этом канале нотифаил уже :D

Anton
31.01.2017
09:07:36
прям вчера брал и тестил

он собирает, в логе и с стрейса я вижу что он реально сходил в прок и собрал инфу

Google
lastsky
31.01.2017
09:07:53
чиорд :) спасибо, ща закатаю 0.12 что ж я что ж я пропустил такое

Maxim
31.01.2017
09:08:04
https://github.com/influxdata/telegraf/releases/tag/1.2.0 вроде да

Anton
31.01.2017
09:08:11
но когда пихает в свой вебсервер для сгрёбывания прометеусом, там всё ломается и ничего не работает

циферки замерли и не меняются :(

lastsky
31.01.2017
09:08:38
у меня тож ситуация в связках с прометеусом.

Anton
31.01.2017
09:08:49
ii telegraf 1.2.0-1 amd64 Plugin-driven server agent for reporting metrics into InfluxDB.

Maxim
31.01.2017
09:08:59
вот говно :(

lastsky
31.01.2017
09:09:20
(но я ещё 0.12 даж не видел release notes, пошёл вот читать)

Maxim
31.01.2017
09:09:33
только не 0.12, а 1.2.0

точечки у меня в памяти перепутались

но на самом-то деле это 0.12, конечно :D

Anton
31.01.2017
09:13:08
lastsky
31.01.2017
09:14:06
слежу с помощью специального сервиса, всё что зазвездил на github - присылает нотифаи, один момент

он называется https://sibbell.com/

только не 0.12, а 1.2.0
у меня тоже отложилось так. 1.1.1 стоит

точечки у меня в памяти перепутались
почему я тоже не заметил подвоха? ?

Anton
31.01.2017
09:18:15
хм, кстати кто не знал

можн подписаться на релизы прям с гитхаба в рссочку

https://github.com/hashicorp/consul/releases.atom например

https://github.com/grafana/grafana/releases/tag/v9.9.9-test1

Google
Anton
31.01.2017
09:38:49
лол

lastsky
31.01.2017
09:39:30
огонь. Add minimal documentation to the diskio plugin https://github.com/influxdata/telegraf/compare/1.2.0...master

Phil
31.01.2017
09:40:17
Кстати, а графики на digital ocean уже обсуждали?

Anton
31.01.2017
09:43:05
м?

Phil
31.01.2017
09:46:59
ну там надо запустить do-agent и тогда он будет в панельке метрики какие-то визуализировать. халявно

ptchol
01.02.2017
15:10:40
Господа у меня для вас новость

Алексей
01.02.2017
15:11:06
ура!

ptchol
01.02.2017
15:11:16
monday, january 30th, 2017 - 12:38 am Cacti 1.0.0 released!Свершилось ! можно юзать !

Алексей
01.02.2017
15:11:35
нет. юзать низя. но это победа да

lastsky
01.02.2017
15:14:37
они просто хотели переплюнуть wine, но толку?

Admin
ERROR: S client not available

lastsky
01.02.2017
15:15:23
2017 / cacti: "После 16 лет разработки состоялся релиз системы мониторинга 1.0.0, отображающей изменения отслеживаемых параметров в виде наглядных графиков." 2008/ wine: The Wine team is proud to announce that Wine 1.0 is now available. This is the first stable release of Wine after 15 years of development and beta testing.

никогда бы не подумал, что кактусу 16 лет.

Алексей
01.02.2017
15:17:01
кактус был молод и загорел в 2005-ом

в 2010 он всё еще был неплох

а потом пыщ пыщ. ололо.

Pablo
01.02.2017
15:23:53
А чо, мажорным чем-то в ченжлоге они хвастаются или как?

ptchol
01.02.2017
16:05:50
Да мы ж некомпетентны, мы так, порофлить.

lastsky
02.02.2017
07:05:32
вот говно :(
telegraf 1.2.1 published Feb. 1, 2017 on GitHub

у меня не крашится на связке с прометеем, но я снизил число процессов до двух штук.

Google
Zhenia
02.02.2017
07:12:23
чат, а что из jmx овских метрик стоит мониторить?

треды?

heap_memory

Paul
02.02.2017
13:10:38
коллеги, использующие графану, подскажите пжлст, как правильно настроить аннотацию об аварии. Сейчас выглядит вот так: ALERTS{instance="$node:9100", alertstate="firing"} графана повторят аннотацию каждую минуту.

не могу понять, почему она повторяет раз за разом

Serhio
02.02.2017
13:26:21
а подскажите нет ли в эластике некой ручки на подобии прометеевского -storage.local.retention

Paul
02.02.2017
13:26:59
/_stats/ смотрели?

Serhio
02.02.2017
13:27:53
404 там

Paul
02.02.2017
13:36:12
вот так попробуйте - /_nodes/stats?pretty=true

Serhio
02.02.2017
13:39:45
ну ок и какая из них? Не сочтите за наглость, но я задавал вопрос мало ли кому начётно известно есть или нет и её название. Тратить время на изучение всего выхлопа сейчас как-то не сподручно. Но спасибо и на том...

Paul
02.02.2017
13:41:30
не скажу - так как не знаю, но как минимум там можно попытаться ее там найти.

Serhio
02.02.2017
14:05:41
такой рычажок отсутствует, как выяснилось ) не elastic way

Anton
03.02.2017
09:35:38
чат, а что из jmx овских метрик стоит мониторить?
heap, old gen, new gen, gc cpu usage, gc time spent, survivor space, мб eden space ну и по бинам интересным тебе

такой рычажок отсутствует, как выяснилось ) не elastic way
https://www.elastic.co/guide/en/elasticsearch/guide/current/retiring-data.html

bazuka_joe
03.02.2017
09:52:49
всем привет!

подскажите, есть ли какая-нибудь замена Графиту?

желательно мегабыстрая

Anton
03.02.2017
09:54:30
prometheus

bazuka_joe
03.02.2017
09:55:06
спасибо

Pablo
03.02.2017
09:55:41
WOWZA

Всё так просто?

а как же все альтернативы, или сообщество пришло к консенсусу?

Страница 83 из 681