
Алексей
04.09.2017
11:55:46
я про системы которые "само" знаю только munin :)

ptchol
04.09.2017
11:56:11
netdata
много чего из коробки

Phil
04.09.2017
11:57:14
collectd кстати

Google

Алексей
04.09.2017
11:57:31
это всё не "быстро"
"само" и "быстро" в моём понимании это когда ты такой apt/yum/docker install и хоп весь каластер замониторен и ошибки уже на admin@ падают.

Zhenia
04.09.2017
11:59:40
а так бывает?

Алексей
04.09.2017
12:00:56
ну нет конечно.
но люди использующие слово "быстро" имеют в виду вот это как правило. @op_op_op_op извиняй если не прав.

Andrii
04.09.2017
12:02:12
мне не надо хуяк-хуяк
однако, мне не надо заббикс, этот высер гения:)

ptchol
04.09.2017
12:03:02
обоснуй

User ?
04.09.2017
12:03:02
а так бывает?
Я думаю да. Называется "заказная разработка для тебя"

ptchol
04.09.2017
12:03:18
я вот могу обосновать где заббикс наёбывает все текущие стеки мониторинга как стоячих из коробки

Andrii
04.09.2017
12:03:28

Алексей
04.09.2017
12:03:36

Andrii
04.09.2017
12:03:41

Google

ptchol
04.09.2017
12:05:00
жги
ну нет, обосновывать дело обвиняющего

Алексей
04.09.2017
12:05:24
хорошо. только одно. iops/metric

Andrii
04.09.2017
12:05:57
боже
это же мое субъективное мнение
я ничего не буду доказывать никому, все при своих пускай:)

ptchol
04.09.2017
12:06:11
whisper не лучший с точки зрения производительности на запись

Andrii
04.09.2017
12:07:49
договорились
ты не писал заббикс, случайно?)

One
04.09.2017
12:14:53
я похожую задачку решил нахождением нужного функционала на BRASах, они сами все фиксировали, а к дампу трафика обращался только для разгребания особо проблемных моментов
сбор был организован пассивно, через сплиттер, чтоб не грузить железо миррорингом
wireshark умеет в lua и экспортить в SQL, в базу из сырых дампов складывал им

ptchol
04.09.2017
12:28:36

One
04.09.2017
12:28:37
ротация дампа - неделя, скриптом выдергиваешь нужный временной интервал а до б в SQL, а там уже все несложно

ptchol
04.09.2017
12:29:19

Алексей
04.09.2017
12:35:05
а кто говорит про виспер ?

ptchol
04.09.2017
12:37:18
А, ну так то конечно есть более хорошие стораджи
Вопрос с инструментарием поверх него

Bogdan (SirEdvin)
04.09.2017
16:46:58

Google

Vladimir
04.09.2017
16:47:14
Я? Буду согласен
Все впрочем зависит от того что понимать под производительностью

Denys ??
04.09.2017
17:06:52
/dev/null сильно могуч на запись, а толку.

ptchol
04.09.2017
17:07:29
да и как бы для уровня букинга, может быть и есть проблема в производительности стораджа единичного на запись, но скорее там встают как проблема вопросы шардинга \ решардинга \ репликации и балансинга чтения данных
а для "обывателей", чаще встают вопросы того как работать с метриками после их сбора, купить в хетцнере пару тачек с терабайтом ссд это копейки.

Vladimir
04.09.2017
17:13:16
По записи
На 1 сервер
На го карбоне у нас пока 1м в секунду на 1 сервере выходит в тесте если. И узкое место размер диска. На кх - 2.4 и узкое место сеть
А, ну размер диска тоже
Но чуть позже
И проблем больше с тем что люди идиоты и пишут точки в 2027 и 1970 годах

Vladimir
04.09.2017
17:15:00
Из за багов
На каждую новую точку могут переписать всю историю
Или вообще переписать историю
И что это все надо ребалансить
А что в баки тулз, что в кх это боль. Только разная

ptchol
04.09.2017
17:21:10
бэкапы делайте и из них восстанавливайте :trollface:

Ivan
04.09.2017
17:22:25
это ж бэкап шрёдингера

Google

ptchol
04.09.2017
17:23:34
если не восстановится значит не повезло

Vladimir
04.09.2017
17:27:13
а в том что база так должна уметь

ptchol
04.09.2017
17:32:01
"так" это как ?

Vladimir
04.09.2017
17:32:09
вот как выше )

ptchol
04.09.2017
17:32:20
история же про то что кто то пришёл и записал кривые данные
эт вполне валидная операция

Vladimir
04.09.2017
17:33:20

Admin
ERROR: S client not available

Vladimir
04.09.2017
17:33:24
это могут быть кривые данные
могут быть пересчет и валидные, но другие
@ptchol увы, но база должна уметь или удаление или переписывание истории или и то и то )
а это сильно сокращает список кандидатов

ptchol
04.09.2017
17:36:51

Vladimir
04.09.2017
17:37:14

ptchol
04.09.2017
17:38:43
так проблема чтобы восстановить предыдущую версию
возможность "перезаписи" это как бы уже метод

Vladimir
04.09.2017
17:38:57

ptchol
04.09.2017
17:39:05
а.

Vladimir
04.09.2017
17:39:07
и не огрести потом на чтение

Google

Vladimir
04.09.2017
17:39:10
или мерже
и прочем компакшене

ptchol
04.09.2017
17:41:44
если я правильно понимаю "инплейс" замену как бы никто не любит, а те реешения которые не любят, в случаю изменения данных как раз начинают порождать энтропию, и увеличение "рандомности" ио.
ну и увеличение накладных расходов на компакшенах \ мерджах

Vladimir
04.09.2017
17:42:24

Paul
04.09.2017
18:41:51
коллеги, есть ли тут люди, которые мониторят прометеем postfix? чем экспортируете данные?

Vladimir
04.09.2017
18:42:10
@ptchol так то понятно что везде свои trade off'ы

dmage
04.09.2017
19:02:43
какой дефолтный способ мониторить открытые файловые дескрипторы процесса в заббиксе? zabbix_get отваливается по таймауту, и нигде не вижу способа таймаут увеличить

Nick
04.09.2017
19:39:15
ну способ увеличить, конечно, есть - но лучше всего для длительных операций готовить по крону(?) файл с результатом, а заббиксом его просто считывать
ну еще можно
ls /proc/$pid/fd/|wc -l
это быстрее
?

dmage
04.09.2017
19:57:47
решил остановиться на предвыборке lsof'а через -u и -c
но там крона точно не надо, просто lsof'у надо десяток секунд

Sergey
04.09.2017
20:14:32
всмысле это они сдуру или какой то кейс есть на это и оно "ну нааадо"

Алексей
04.09.2017
20:26:19
место перехода на кликхаус видно невооруденным взглядом

Sergey
04.09.2017
20:31:26
кто то кушает твои данные :)

Алексей
04.09.2017
20:31:38
да. инфлюкс удаляет старые партиции

Vladimir
04.09.2017
20:31:38
Нет
вопрос в количестве данных )