
Vladimir
07.03.2017
19:59:38

Pablo
07.03.2017
20:01:26
Пробовал кто?

Vladimir
07.03.2017
20:01:34
я собрать не смог (

Google

Алексей
07.03.2017
20:01:58

Pablo
07.03.2017
20:03:09
Ой нет
Мы своё всегда
На сжатие интересно посмотреть

Алексей
07.03.2017
20:04:56
вы свой сторадж пишите ?

Pavel
07.03.2017
20:06:17
все пишут свой сторадж :)
рано или поздно :)
/me окинул взглядом свой коннектор к Whisper на C++ на 3к строк
"Beringei is a high performance, in-memory storage engine for time series data."
судя по описанию, там нет персистенси вообще

Vladimir
07.03.2017
20:14:20

Pavel
07.03.2017
20:14:28
а с таким раскладом можно выставить std::unordered_map и сходу получить 20m qps:)

Vladimir
07.03.2017
20:14:39

Google

Pavel
07.03.2017
20:14:54
а заче на первом тиере сжатие?

Vladimir
07.03.2017
20:15:19

Pablo
07.03.2017
20:15:26

Pavel
07.03.2017
20:15:28
zram есть :)
тупо сжать озу) быстро и сердито)
есть еще tmpfs со сжатием, AFAIK

Vladimir
07.03.2017
20:15:54
и даже лучше

Pablo
07.03.2017
20:16:01
Z на рандмных float'ах мало дает и долго
О!)

Pavel
07.03.2017
20:16:38
2.5 точек в секунду это мало же

Vladimir
07.03.2017
20:16:46

Алексей
07.03.2017
20:16:49

Vladimir
07.03.2017
20:17:29

Pavel
07.03.2017
20:17:34
ну требования своих, вообще задача TSDB бьется в те же самые траблы, что задача поиска "оптимального" хэша под задачи :)

Vladimir
07.03.2017
20:17:35
без сжатия

Алексей
07.03.2017
20:18:06
вообще очевидно что 2,5 милионна точек в секунду это мало.

Vladimir
07.03.2017
20:18:23
если будет просто запихнуть больше - запихнут больше :(

Алексей
07.03.2017
20:18:44
для сбора в реалтайме информации о небольшом городе скажем в 300к людей это _не так много метрик на человека_

Pavel
07.03.2017
20:19:06
о каждом узле в интернете веселее :)

Google

Алексей
07.03.2017
20:19:17
поверь мне. про людей точно веселее.

Vladimir
07.03.2017
20:19:24
да даже банально о каждом инстансе приложения если начать собирать много параметров будет уже весело )

Pavel
07.03.2017
20:19:44
я время от времени дополняю вот эту страничку https://github.com/pavel-odintsov/fastnetmon/wiki/Traffic-Counters-Structures-performance-evaluation
ибо in-memory TSDB у меня внутри приложения и работает оно оч быстро
но проблемы - те же, просто масштаб меньше и кое-что решается намного проще

Vladimir
07.03.2017
20:21:24
@pavel_odintsov имея жирную in-memory базу на 48 часов данных можно начать строить всякие корреляции интересные
например
и еще веселее если умудриться впихнуть неделю данных

Pavel
07.03.2017
20:21:40
у меня к счастью все проще, мне хватает последнего поулчаса, часто - меньше
данные старее - тупо не нужны

Vladimir
07.03.2017
20:21:52

Pavel
07.03.2017
20:21:53
трафик-с.

Pavel
07.03.2017
20:22:02
ну тогда да, другой вопрос

Vladimir
07.03.2017
20:22:04
где-то 30% запросов за последние 7 дней
и 10% все остальное
правда это по тем запросам где явно прописано
по тем где неявно надо еще подумать как посчитать правильно

Pavel
07.03.2017
20:23:07
но-таки самый простой вариант, когда память у приложения локальная
пусть да же SHM

Vladimir
07.03.2017
20:23:26
модифицировать приложение сложно (

Google

Pavel
07.03.2017
20:23:28
тот же графит просто убожественно кодирует данные

Vladimir
07.03.2017
20:23:31
особенно если не ты пишешь

Pavel
07.03.2017
20:23:39
pickle - вариант, но под него нет ничего нормального для С
а все text based это оч плохо, сначала тратишь ресурсы чтобы в текст загнать, потом чтобы выгнать %)
моя мечта - tsdb с поддержкой capnp :)

Pablo
07.03.2017
20:24:20

Vladimir
07.03.2017
20:24:21

Pablo
07.03.2017
20:24:25
*так

Pavel
07.03.2017
20:24:33
протобаф. сочувствую.

Admin
ERROR: S client not available

Vladimir
07.03.2017
20:24:34

Pavel
07.03.2017
20:24:54
потому что куча аллокации памяти на стеке и куча копирований памяти :)

Vladimir
07.03.2017
20:25:06

Pavel
07.03.2017
20:25:15
https://capnproto.org/cxx.html#lessons-learned-from-protocol-buffers
собственно, у capnp и протобафа - автор один

Алексей
07.03.2017
20:25:27

Pablo
07.03.2017
20:25:41
Вот и я не пойму

Vladimir
07.03.2017
20:25:55
я даю сервис, люди им пользуются

Google

Pavel
07.03.2017
20:26:08
ну кому-то позарез надо :)

Vladimir
07.03.2017
20:26:09
пока не начинают слать мусор я их не трогаю

Pavel
07.03.2017
20:26:12
те же финансы )))

Vladimir
07.03.2017
20:26:32
24 часа - потому что по офису куча мониторов которые графики отображают, там обычно за 24 часа

Pavel
07.03.2017
20:26:33
так что кейсов много и не смотря на общее название TSDB все эти сериес ой какие разные)

Vladimir
07.03.2017
20:26:51
я очень хочу попробовать как side-project сделать сбор данных с профилировщиков в приложениях и отчеты по ним
и с ОС туда же статистику, даже банальную по времени работы сисколов для каждого pid'а.

Алексей
07.03.2017
20:28:42
perf чтоли переизобрести ?

Vladimir
07.03.2017
20:28:51
чтобы оно постоянно слало данные по тому что творится в системе

Алексей
07.03.2017
20:29:17
боюсь твоего подхода.

Pavel
07.03.2017
20:29:21
а зачем так углубляться?

Vladimir
07.03.2017
20:29:23

Pavel
07.03.2017
20:29:26
это слишком, имхо.

Vladimir
07.03.2017
20:29:38
а зачем так углубляться?
кажется что позволит получить много интересной статистики в случаях когда все плохо, но непонятно почему

Алексей
07.03.2017
20:29:45
потому что это как идея потенциально полная замена тестированию в ядре

Vladimir
07.03.2017
20:30:01

Pavel
07.03.2017
20:30:02
sysdig на этом денег миллион привлек
они именно это делают

Алексей
07.03.2017
20:30:11
сисдиг да

Pavel
07.03.2017
20:30:13
метрики с ядра в аналитику и отчеты тебе красивые