@metrics_ru

Страница 122 из 681
Pavel
11.03.2017
11:33:36
capnp ответ на проблему

кто юзал протобаф для оптимизации ССЗБ, увы

там чудовищное число аллокаций, копирований и вообще все оч тяжело для быстрых вещей

Vladimir
11.03.2017
11:34:26
@pavel_odintsov это зависит от реализации либы

Google
Vladimir
11.03.2017
11:34:41
gogoprotobuf довольно оптимизирован и почти без дополнительных алокаций

притом давно уже

и в 3-ем еще лучше стало

но то что тебе нужно при анпаке иметь 20160 float64 + 20160 bool'ов это не отменяет никак

Pavel
11.03.2017
11:35:18
он все равно очень оверхедистый и полностью выделения памяти не убирает и не решает распухший протоколв)

Vladimir
11.03.2017
11:35:48
@pavel_odintsov да в протоколе проблемы нет, чо ты к нему привязался?

проблема в том что у человека 90 тысяч метрик по 200кб на каждую

и это довольно много

память оно будет жрать в любом случаи

Pavel
11.03.2017
11:36:26
я привязался к скорости диска и сети :)

Vladimir
11.03.2017
11:36:41
@pavel_odintsov которая вообще тут роли не играет

@pavel_odintsov мы решаем проблему в том что код алоцирует много памяти и выжирает 64ГБ оной. Притом что 1 дашборд выжирает порядка 11 ГБ

Pavel
11.03.2017
11:37:55
90 тысяч по 200 кб это 18 гигов!

Google
Pavel
11.03.2017
11:37:59
хренасебе не влияет

Vladimir
11.03.2017
11:38:13
хренасебе не влияет
ну и расскажи как скорость сети влияет на то что к нему приходит OOM? :)

когда память заканчивается

Pavel
11.03.2017
11:38:51
а, вижу, у вас тикет есть привязанный

я думаю проблема с тормозами

нашел, да, софт баг)

Vladimir
11.03.2017
11:39:40
@pavel_odintsov с точки зрения передачи данных там повеселее - если диски справляются, то потом оно в том же protobuf'е хорошо компактизируется, плюс поверх gzip еще

вероятно там гоняется далеко уже не 18ГБ

Pavel
11.03.2017
11:40:04
увы, но даблы жмутся из рук вон плохо

Vladimir
11.03.2017
11:40:08
если данные хорошие, то я бы даже сказал там сотни мегабайт

увы, но даблы жмутся из рук вон плохо
на самом деле лучше чем ты думаешь )

Pavel
11.03.2017
11:40:32
я бы даже сказал жмутся они не в задницу) если precision не срезано в разумных пределах :)

я делал рисерч, перекодированные в юинт64 с ограниченной точностью жмутся где-то в 3-5 раз лучше

Pavel
11.03.2017
11:41:26
проблема в представлении даблов в памяти, там всегда есть куча странных цифр в конце которые для тех же чисел дают разный результат

Vladimir
11.03.2017
11:41:30
а если взять как компрессор не gzip а double-delta то на правильных данных оно еще лучше будет

Pavel
11.03.2017
11:41:30
когда 10.0 != 10.0

Vladimir
11.03.2017
11:41:50
или компрессию аля прометеус

Pavel
11.03.2017
11:41:54
это кстати еще одна проблема графита)

Paul
11.03.2017
16:52:20
или компрессию аля прометеус
а где в прометеусе компрессия? Или я что-то пропустил?

Google
Vladimir
11.03.2017
16:53:11
где то у них было описание как они делали сжатие

Paul
11.03.2017
17:13:05
о, интересно, спасибо. Объемы у нас пока смешные, но разница почти втрое на метрику - радует несказанно

Vladimir
13.03.2017
19:39:31
Шпам?

Paul
14.03.2017
11:36:17
Шпам?
главное, такой сайт емкий. Наполненный

Zhenia
15.03.2017
08:57:23
чат, а кто как рейд мониторит? если он хардварный

Олег
15.03.2017
08:58:17
прикручиваешь фирменную утилиту-чекалку и поехали... наверное

Pavel
15.03.2017
08:59:12
Только так

Как иначе

Zhenia
15.03.2017
09:01:22
ну, через text_collector? я просто не хочу давать рута мониторингу

Олег
15.03.2017
09:01:56
смотря какая у тебя система мониторинга

а вообще есть suid, что, впрочем, тоже не слишком безопасно

Олег
15.03.2017
09:02:29
можно дать судоера на скрипт, который запускает фирменную утилиту и вынимает инфу о состоянии рейда

Pavel
15.03.2017
09:05:25
Судоэрс, да

Стандартная практика

Zhenia
15.03.2017
09:06:45
окей, спасибо

Paul
15.03.2017
09:12:57
кстати, кто-нибудь из присутствующих может подсказать, как мониторить рэйд в прометее? хотя бы на уровне "ок/не ок". Для упрощения задачи представим, что рейд может быть любым

Pavel
15.03.2017
09:13:51
Ууууу

Любым это 150 массивов со вложенностью и по 15 дисков каждый?;)

я бы ограничился ок не ок для всех массивов сразу

Google
Paul
15.03.2017
09:15:05
опять же упрощая - я могу прометею возвращать любые данные, просто скриптом вопрос в том, как скормить прометею это ок/не ок

тот же вопрос по смарт

Pavel
15.03.2017
09:16:07
сложные вопросы вы задаете

В фаствпсе я такую систему два года строил

Admin
ERROR: S client not available

Pavel
15.03.2017
09:16:38
Со смартом вообще все плохо

Каждый диск - свои маркеры сбоя

Paul
15.03.2017
09:20:22
да нет, вопрос на самом деле довольно простой. Нужен способ простого экспорта метрик по шаблону, аналога zabbix user_script. Но я пока не нашел, как это сделать

lastsky
15.03.2017
09:27:24
кроме megacli которую депрекейтнули в node_exporter и textfile_collector чот не знаю способов.

Paul
15.03.2017
09:29:41
text_collector подходит идеально, спасибо

Anton
15.03.2017
09:30:40
кроме megacli которую депрекейтнули в node_exporter и textfile_collector чот не знаю способов.
и там ещё нтп выкинули на мороз, он теперь отдельно идёт; надеюсь сможет сразу у кучи нтп серверов про время спрашивать, чтобы их 12 штук не запускать :)

Zhenia
15.03.2017
09:33:43
ну, megacli можно в node_exporter запустить вроде

lastsky
15.03.2017
09:35:52
и там ещё нтп выкинули на мороз, он теперь отдельно идёт; надеюсь сможет сразу у кучи нтп серверов про время спрашивать, чтобы их 12 штук не запускать :)
я тоже логики не понял. говорить о том, что node_exporter - "is made for pure server metrics" (с), выпиливая ntp и megacli одной рукой, впиливая wifi_linux.go другой.

Anton
15.03.2017
09:38:01
я думаю надо в ишьюсах написать, вы че дураки вифи включать и выпилвать нтп?

Sergey
15.03.2017
09:38:22
Anton
15.03.2017
09:38:24
ну типа про нтп понятно, там хороший код который прям не ресурсоёмкий такой, а про вифи ничего не знаю :(

а вифи не включен подефолту, как и нтп кстати говоря

никто же не запрещает самому собрать нод экспортер без кода про вифи вообще :)

Олег
15.03.2017
09:39:36
ну в центоси 7ой же по дефолту wpa_supplicant стоит и запущен :)

Google
Олег
15.03.2017
09:39:42
вместе с network-manager

lastsky
15.03.2017
09:44:48
а таки на ваших серверах нет вайфай? :)
ах да, это же новое слово техники - ЦОД без проводов и патчпанелей. и wifi роутеры juniper под потолком.

Sergey
15.03.2017
09:45:12
ах да, это же новое слово техники - ЦОД без проводов и патчпанелей. и wifi роутеры juniper под потолком.
ну так да. нет проводов - нет тупых инженеров, которые не полностью вставляют шнур.

Denys ??
15.03.2017
09:45:46
Доброго всем! Мож кно нить подскажет умеет ли Alerta принимать алерты от Графаны через вебхуки? В коде что то такое есть, документация говорит многозначительное "TBC"...

Антон
15.03.2017
11:43:56
а так вообще вроде может https://github.com/guardian/alerta/blob/master/alerta/app/webhooks/views.py#L654

ptchol
16.03.2017
10:54:10
@alexanderzobnin привет ! А хитмап плагин со старенькой 4.0.2 графаной будет работать ?

Alexander
16.03.2017
10:55:36
Привет. Должен работать.

Dorian
16.03.2017
10:56:57
Джентельмены Вопрос имею по ES

Alexander
16.03.2017
10:56:58
Правда, релизить отдельно его не собираемся, хотим включить в поставку графаны как стандартный.

Dorian
16.03.2017
10:57:15
Есть ES, куда filebeat скидывает инфу с машин

Есть какая-нить вменяемамая дока по созданию запросов?

elastic.co в своей документации расстраивает (

Alexander
16.03.2017
10:57:49
Так что ответ двоякий какой-то получился ?

ptchol
16.03.2017
10:58:02

Страница 122 из 681