@metrics_ru

Страница 132 из 681
Pavel
29.03.2017
15:52:21
в моих тестах мне удавалось жать CH еще сильнее

я тупо брал бд CH за прошлый месяц и хреначил bzip'ом :)

Roman
29.03.2017
15:52:49
Тока вопрос - демон на чем? На гошке?

Pavel
29.03.2017
15:53:04
на плюсах, это часть FastNetMon Advanced

Google
Pavel
29.03.2017
15:53:16
я думаю на го тоже будет ОК

главное собирать батч на несколько тысяч флоу и лишь как он накопится сбрасывать в CH

Vladimir
29.03.2017
15:53:51
это про люубую почти базу справедливо

никто не любит 1 млн мелких записей

Pavel
29.03.2017
15:54:03
мы бы свой открыли, но он насмерть завязан на наши форматы представления пакетов, смысла от этого будет мало

оно capnp юзает там, в общем сложнее будет интегрировать чем напейсать нетфлоу

Roman
29.03.2017
15:54:55
Pavel
29.03.2017
15:55:44
в основном да, иногда какие-то вещи, которые не осиливаю наемные программисты

Roman
29.03.2017
15:56:11
А ты где работаешь если не секрет? Контракты какие то?

Pavel
29.03.2017
15:57:05
работаю я в Cloudflare, DNS инженер, а FNM - это мой личный проект, в свободное от работы время

Pavel
29.03.2017
15:58:27
а клиенты там разные, но львиная долая - бесплатные на опенсорсной версии

Google
Pavel
29.03.2017
15:58:41
PostgreSQL, как ни странно

но не он сам, на его базе есть несколько реализаций column based databases

они как плагины работают

но говорят там надо дьявола призавть, прежде чем их развенешь 5)

Roman
29.03.2017
15:59:25
С постгрессом же есть проблемы кластеризации

Pavel
29.03.2017
16:00:05
у всех они есть :)

если нет петабайт метрик я бы тыпо поставил СХД теров на 100 с одной тачкой )

и не парился, чесслово

отсутствие кластеризации резко минимизирует боль в заду.

Daniel
29.03.2017
16:00:59
а потом тачка бы навернулась

Vladimir
29.03.2017
16:01:03
По этому вопросу еще может кто то что то сказать?
Под твой конкретный кейс в любом случаи придется расчехлять IDE и писать. ES больше под offline-анализ, когда нужно много всякого разного искать, странного. Короче когда тебе lucene нужен.

Потому что по объемам ему плохеет быстрее чем кликхаусу, зато нечеткие схемы можно впихивать

Daniel
29.03.2017
16:01:38
да не нужно ему ничего, кроме большого хранилища

и грепа

большое хранилище - это жопа, если быть честным

Vladimir
29.03.2017
16:02:01
логи в него класть, как первый шаг, очень даже хорошая идея. Мы тут постепенно свой код на структурированные логи переводим и шлем это в ES

Pavel
29.03.2017
16:02:02
как навернулась, так и бы и развернулась с нуля со склада :)

если нет такой же тачки на складе - это ссзб, увы.

Daniel
29.03.2017
16:02:47
если у вас есть СХД на 100Т - у вас есть и склад, и запас, я понимаю

но, вообще-то, нормальные люди на месте ценника такого решения теряют дар речи и пучат глаза

Google
Pavel
29.03.2017
16:03:13
ага, супермикра на 76 винтов :)

Vladimir
29.03.2017
16:03:16
на кликхаус выше порог вхождения (меньше готового в опенсорсе)

но можно больше получить

Daniel
29.03.2017
16:03:33
Pavel
29.03.2017
16:04:10
работало норм, я более не работаю там где у меня это было

но вроде не говорили что упало :)

Vladimir
29.03.2017
16:04:26
В него - кого?
В Эластик.

Daniel
29.03.2017
16:04:51
работало норм, я более не работаю там где у меня это было
а у меня - в ремонте проводит больше времени, чем работает

Pavel
29.03.2017
16:04:55
эластик имхо оверхедить будет

Vladimir
29.03.2017
16:05:10
если твоя задача ложиться на сложить логи с не очень большой скоростью (порядка 100к строк в секунду макс) и дисков вагон и маленькая тележка - возьми для начала ES

Pavel
29.03.2017
16:05:21
боюсь, что просто не повезло, мне с деллами 720ми не везло, они сыпались еженедельно по неведомой херне :)

Vladimir
29.03.2017
16:05:22
как быстрый способ получить результат

Vladimir
29.03.2017
16:05:38
поанализируй что ты реально делаешь

Roman
29.03.2017
16:05:55
Не нужно вобще там SSD и скорость. А вот возможность несколько инстансов подключить для балансировки - нужно

Vladimir
29.03.2017
16:05:58
и еще в индексе должно быть мало строк
ну да, само собой. Просто простой способ начать )

Roman
29.03.2017
16:13:49
Тогда следующий вопрос - для передачи события приложения какой протокол использовать? Есть готовые REST клиенты для того же ES?

Vladimir
29.03.2017
16:15:03
@RShishkin у нас оно сделано может быть слегка через задницу, но приложение шлет данные в rsyslog, rsyslog обогощает дополнительной метаинформацией и шлет в кафку из которой это складывается в ES.

Google
Roman
29.03.2017
16:16:00
У меня мобильное приложение

Vladimir
29.03.2017
16:19:00
У меня мобильное приложение
делать post request в твой веб

который будет писать лог

ptchol
29.03.2017
16:19:23
вобще постики в файлик сохранять не такая сложная задача.

Vladimir
29.03.2017
16:19:25
с мобильным приложением интереснее - если вот прям совсем эвенты то может быть лучше сразу кликхаус взять

да можно на Го налабать сервис за полчаса

ptchol
29.03.2017
16:19:42
лучше только сразу сериализовать во что то типа протобафа \ авры

Vladimir
29.03.2017
16:19:55
да, лучше по возможности в нейтив формате слать

то есть кодировать бинарями

Admin
ERROR: S client not available

ptchol
29.03.2017
16:20:08
и протобаф поделить между твоим сервисом и мобильным приложением

Roman
29.03.2017
16:20:24
Я знаю тока protobuf и msgpack

ptchol
29.03.2017
16:20:48
у вас тогда протокол появится и сможете версионировать изменения в событиях и всём таком иначе через пару лет бардак будет )

мы тут выкарабкивались год из такого

Roman
29.03.2017
16:21:06
Но в отладке будет сложнее бинарный протокол?

Vladimir
29.03.2017
16:21:21
Я знаю тока protobuf и msgpack
тут еще кстати вопрос в том как оно будет работать на плохой сети )

Но в отладке будет сложнее бинарный протокол?
tcpdump'ом уже не попыришь, а в остальном приложение ж

по бинарным данным селекты проще делать

Roman
29.03.2017
16:21:38
Сеть хорошая слава богу

Google
Vladimir
29.03.2017
16:21:45
но если ты людей ценишь то у тебя и так будет https

а там уже не мешает логировать на уровне веб-сервера столько, сколько надо

Pavel
29.03.2017
16:22:01
gRPC :)

capnp :)

msgp - имба, да

автор capnp со мной работает, могу потыкать

Roman
29.03.2017
16:22:47
gRPC :)
Вот накидали зашибись! Я все эти слова знаю но опыта нет

Pavel
29.03.2017
16:23:10
gRPC дьявольская вещь, как ни странно по WAN вполне ок)

Roman
29.03.2017
16:24:26
Давайте еще пару вводных сделаем. Добавить стандартные timeseries метрики, что бы запросы пушил клиент по тому же протоколу

Pavel
29.03.2017
16:24:37
уууууу :)

обрисуй всю задачу, а?

а-то ты каждое требование оглашаешь и оно сужает все хотелки шибко

ptchol
29.03.2017
16:25:13
и тут вносят желуди и пластелин

Vladimir
29.03.2017
16:26:06
@RShishkin если бы я делал с нуля, то я бы выбрал примерно такой подход: 1. Слал от приложения только эвенты и ничего кроме эвентов. Впрочем эвент может содержать и похожие на time-series данные. 2. Слал бы их по https, например protobuf или msgpack внутри POST запросов. 3. В хттп сервере на первых порах складывал бы все в виде json в kafka -> elasticsearch или kafka -> clickhouse

и уже по данным из ES/CH строил бы графики по тем эвентам которые содержат полезную статистику

Roman
29.03.2017
16:26:29
Ну клиент посылает метрики на сервер метрик и события на сервер событий. Как то так. Аутентификация наверно будет нужна не знаю.

Vladimir
29.03.2017
16:27:04
возможно на этапе 2 делил бы эвенты и метрики. Вопрос дальше в количестве такого и во времени на разработку.

Roman
29.03.2017
16:27:37
Кафка какую конкретно задачу решает? Или проблему?

Очередь?

Vladimir
29.03.2017
16:28:32
Daniel
29.03.2017
16:28:37
эластик - тормоз

и с этим надо как-то бороться

Vladimir
29.03.2017
16:28:59
эластик - тормоз
но у него порог вхождения ниже. Если поток маленький на нем можно сделать proof of concept

Страница 132 из 681