
Михаил
30.03.2017
11:09:49
можно усредненное

Zhenia
30.03.2017
11:10:00
rate(node_network_transmit_packets[30s])/30
но толку от такой метрики, я не понимаю

Paul
30.03.2017
11:12:06
я хочу pps
что тебе мешает снимать раз в 30 секунд? полученую цифру делишь на 30 и получаешь средний ппс

Google

Михаил
30.03.2017
11:13:32
да вот я сижу и туплю, как мне нормально снимать параметр PPS

Pavel
30.03.2017
11:16:52
с ifconfig ну либо с /proc
у меня в бложике было, щаз найду
https://www.stableit.ru/2014/08/pps.html
прошу

Paul
30.03.2017
11:17:46

Pavel
30.03.2017
11:18:09
pps это крайне важная характеристика
размывать ее по 30 секундам бессмысленная трата времени.
оно должно считаться по секундам, если хочется получить что-то полезное (микроберсты? ддосы?)

Paul
30.03.2017
11:19:13
никто не спорит, но нужно понимать, какая точность необходима. Точность стоит дорого, и чем выше точность - тем дороже это будет. Точность в 100мс - это боль. Над точностью в 10мс у нас целый отдел воевал как-то

Pavel
30.03.2017
11:19:59
кто ж говорит про миллисекунды) секунды - ОК

Dmitry
30.03.2017
11:21:11
смотря для каких целей PPS измерять
если микроберсты ловить - то и секунды слишком грубо

Google

Pavel
30.03.2017
11:22:39
проще воткнуть везде десятки, чем их ловить :)
ну или 100GE, сразу.

Paul
30.03.2017
11:22:58

Vladimir
30.03.2017
11:23:15
Если микроберсты, то мне кажется надо уже лезть в ядро, ловить нужные эвенты, сдать их в базу, а потом уже делать статистику

Pavel
30.03.2017
11:23:17
зато на вырост :)

Dmitry
30.03.2017
11:23:20
и как тебе десятки помогут?

Pavel
30.03.2017
11:23:38
запасом емкостей

Dmitry
30.03.2017
11:24:21
там буферы нужны, а не полоса

Pavel
30.03.2017
11:24:34
зависит от задач и причины появления берстов

Dmitry
30.03.2017
11:25:14
я про то, что с секундным интервалом на pps уже ничего не видно будет

Pavel
30.03.2017
11:25:31
все же от задачи зависит. ддос - будет видно, микроберст - вряд ли.
откуда мне знать чего автор добивается? :)
мы вообще наносекунды храним для pps, но это же не повод, правда? :)

Zhenia
30.03.2017
11:43:22
а для чего, если не секрет

Pavel
30.03.2017
11:43:34
у нас DDoS сенсор
трафика нередко под 100 миллионов пакетов секунду, поэтому нужна высокая точность, чтобы найти зловредный поток / пакет

Михаил
30.03.2017
11:45:16
автор хотел посмотреть примерные PPS
сколько сети потребляет 5 виртулок например

Pavel
30.03.2017
11:49:03
тогда 30 секунд ОК :)

Google

Михаил
30.03.2017
12:24:27

Pavel
30.03.2017
12:24:41
угу

Олег
31.03.2017
13:51:04
кто знает, как создать организацию в графане через API?
добыл себе апи ключик, подключаюсь, а оно мне аксес денаед
логинюсь под глобальным админом
http-авторизация которую где-то рекомендовали не проходит
вопрос снят, wget не отправлял http-auth

Pavel
31.03.2017
14:25:02
а планов норм апи на го сделать нету?
я вот юзера хочу создавать, датасорс раскатывать и дашборды импортировать не вовлекая юзера

Alexander
31.03.2017
14:42:34
графана очень плохо автоматизируема на данный момент, к сожалению

Daniel
31.03.2017
14:43:29

lastsky
31.03.2017
14:43:42

Alexander
31.03.2017
14:44:54

Alexander
31.03.2017
14:45:05
выбора нет, но надо понимать что это оупенсорц, какие претензии – не нравится, пишем пропозалы, и может быть пишем такое нужное API
вот и товарищи выше подтверждают

Alexander
31.03.2017
14:46:39
Да, насчет дашбордов была дискуссия, открыли тикет

Alexander
31.03.2017
14:47:30
ну мне большего пока и не надо, сделают дашборды – будет счастье (и новые потребности)

Олег
31.03.2017
15:15:15
чего не хватает?

Google

Pavel
31.03.2017
15:15:42
все хватает :)

Konstantin
31.03.2017
15:17:53
какая бд лучше под пром? influx?
вопрос снят

Олег
31.03.2017
15:24:14
что выбрал?

Roman
31.03.2017
15:28:00

Антон
31.03.2017
15:32:29

Pavel
31.03.2017
15:44:16
под пром?
что такое пром?

Admin
ERROR: S client not available

User ?
31.03.2017
15:44:58

Konstantin
31.03.2017
15:53:31
у меня кстати вопрос , а есть ли где нибудь уже готовые .rules для алертов?
для пром

Maxim
31.03.2017
15:58:59
для алертов в вакууме?

Zhenia
31.03.2017
16:13:00
Алерт менеджера скорее всего

Konstantin
31.03.2017
16:33:51
Дада, я про него
Просто заметил что почти нету нигде готовых триггеров для алерт менеджера

Alexander
31.03.2017
16:40:52
у автора в блоге кой-чо есть
а так прям готовое сложно представить, проще на примерах научится и не бояться писать свои

Timur
01.04.2017
08:41:00
чет меня influx + telegraf за графаной реально пугать начали
на тестовых виртуалках (слабоватых, но все же), при retention policy на две недели, можно с дашборда спросить инфу за месяц и наблюдать следующие спецэфекты:
- проц на виртуалке с инфлаксом улетает в потолок
- в инфлаксе сыпяться server/client ошибки
- (что самое неприятное) все это за собой тянет виртуалку, на которой стоит телеграф (собирая http статусы с ~80 хостов

Google

Timur
01.04.2017
08:46:05
это при том, что в обычном состоянии на виртуалках не более 5% cpu usage

Maxim
01.04.2017
09:18:27
прометей тоже нормально так пожевывает ;)

Vladimir
01.04.2017
10:06:19

Anton
01.04.2017
10:09:09
стоит ретеншн на 62 дня, и когда прошу отрисовать борду за эти самые 2 месяца, пром жрёт много проца, в смысле весь, на тачке 12 цпу\24 гига

Timur
01.04.2017
10:21:02
с одной стороны не проблема иметь две разных базы, одну для графаны, другую для аналитических каких то целей
с другой стороны если даже смена rp в таком случае не сильно спасает и есть возможность уронить не себя, а того кого ты мониторишь, то это ваще адово
а в графане никак обрубить у вьюверов возможность спрашивать за большие интервалы времени нельзя?

Anton
01.04.2017
10:42:00
если в самом проме прокрутить тот же запрос на такой же объём по времени
он отваливается по ТО, который в морде прома 30 сек

Timur
01.04.2017
11:41:53
типа "вы бы, сударь, конкретный диапазон указали, ато через 30 секунд пока я буду тупить над одним запросом, у меня второй такой же появиться"?
надо наверное в кои то веки код, что графаны, что бд покурить, неужто все только изза такой несогласованности во взаимодействии

Anton
01.04.2017
17:00:14
не, дефолтный в борде по моему час выбирается, если ты тыкаешь в graph
за час построить ок, а вот за 62 дня уже трудно, особенно если нужно делать бери все метрики за 5 минут, считай чтонибудь сложнее авеража, потом показывай

Timur
02.04.2017
07:28:41

Александр
02.04.2017
07:29:19
5 минут на 1 пиксель?

Timur
02.04.2017
07:33:40
Мой посыл в том, что если ты графики строишь для периода 62 дня, нет смысла минимальный период агрегирования делать меньше 1-2 часов.

Alexander
02.04.2017
10:57:16

User ?
02.04.2017
11:15:07
Подскажите, есть ли разница под ELK в фс? xfs vs ext4?

Алексей
02.04.2017
11:17:09
да. особенно для кибаны.

User ?
02.04.2017
11:18:47
elasctic основную нагрузку давать будет же