@metrics_ru

Страница 134 из 681
Михаил
30.03.2017
11:09:49
можно усредненное

Zhenia
30.03.2017
11:10:00
rate(node_network_transmit_packets[30s])/30

но толку от такой метрики, я не понимаю

Paul
30.03.2017
11:12:06
я хочу pps
что тебе мешает снимать раз в 30 секунд? полученую цифру делишь на 30 и получаешь средний ппс

Google
Михаил
30.03.2017
11:13:32
да вот я сижу и туплю, как мне нормально снимать параметр PPS

Pavel
30.03.2017
11:16:52
с ifconfig ну либо с /proc

у меня в бложике было, щаз найду

https://www.stableit.ru/2014/08/pps.html

прошу

Paul
30.03.2017
11:17:46
да вот я сижу и туплю, как мне нормально снимать параметр PPS
тебе нужно снимать PPS не каждую секунду а с определенной точностью. Подумай о том, какая точность тебе нужна. Для трендов 30 секунд достаточно. В редчайших случаях нужна точность в 5-10 секунд на измерение, но это прям реально редкость

Pavel
30.03.2017
11:18:09
pps это крайне важная характеристика

размывать ее по 30 секундам бессмысленная трата времени.

оно должно считаться по секундам, если хочется получить что-то полезное (микроберсты? ддосы?)

Paul
30.03.2017
11:19:13
никто не спорит, но нужно понимать, какая точность необходима. Точность стоит дорого, и чем выше точность - тем дороже это будет. Точность в 100мс - это боль. Над точностью в 10мс у нас целый отдел воевал как-то

Pavel
30.03.2017
11:19:59
кто ж говорит про миллисекунды) секунды - ОК

Dmitry
30.03.2017
11:21:11
смотря для каких целей PPS измерять

если микроберсты ловить - то и секунды слишком грубо

Google
Pavel
30.03.2017
11:22:39
проще воткнуть везде десятки, чем их ловить :)

ну или 100GE, сразу.

Paul
30.03.2017
11:22:58
ну или 100GE, сразу.
очень дорого

Vladimir
30.03.2017
11:23:15
Если микроберсты, то мне кажется надо уже лезть в ядро, ловить нужные эвенты, сдать их в базу, а потом уже делать статистику

Pavel
30.03.2017
11:23:17
зато на вырост :)

Dmitry
30.03.2017
11:23:20
и как тебе десятки помогут?

Pavel
30.03.2017
11:23:38
запасом емкостей

Dmitry
30.03.2017
11:24:21
там буферы нужны, а не полоса

Pavel
30.03.2017
11:24:34
зависит от задач и причины появления берстов

Dmitry
30.03.2017
11:25:14
я про то, что с секундным интервалом на pps уже ничего не видно будет

Pavel
30.03.2017
11:25:31
все же от задачи зависит. ддос - будет видно, микроберст - вряд ли.

откуда мне знать чего автор добивается? :)

мы вообще наносекунды храним для pps, но это же не повод, правда? :)

Zhenia
30.03.2017
11:43:22
а для чего, если не секрет

Pavel
30.03.2017
11:43:34
у нас DDoS сенсор

трафика нередко под 100 миллионов пакетов секунду, поэтому нужна высокая точность, чтобы найти зловредный поток / пакет

Михаил
30.03.2017
11:45:16
автор хотел посмотреть примерные PPS

сколько сети потребляет 5 виртулок например

Pavel
30.03.2017
11:49:03
тогда 30 секунд ОК :)

Google
Михаил
30.03.2017
12:24:27
тогда 30 секунд ОК :)
то есть если мне отдается значение 20к то это 20к пакетов за 30 секунд получается?

Pavel
30.03.2017
12:24:41
угу

Олег
31.03.2017
13:51:04
кто знает, как создать организацию в графане через API?

добыл себе апи ключик, подключаюсь, а оно мне аксес денаед

логинюсь под глобальным админом

http-авторизация которую где-то рекомендовали не проходит

вопрос снят, wget не отправлял http-auth

Pavel
31.03.2017
14:25:02
а планов норм апи на го сделать нету?

я вот юзера хочу создавать, датасорс раскатывать и дашборды импортировать не вовлекая юзера

Alexander
31.03.2017
14:42:34
графана очень плохо автоматизируема на данный момент, к сожалению

Daniel
31.03.2017
14:43:29
lastsky
31.03.2017
14:43:42
Alexander
31.03.2017
14:44:54
Alexander
31.03.2017
14:45:05
выбора нет, но надо понимать что это оупенсорц, какие претензии – не нравится, пишем пропозалы, и может быть пишем такое нужное API

Вы именно про возможности API?
ну общее впечатление такое, те же дашбоды самый удобный способ установки для них – ручной

вот и товарищи выше подтверждают

Alexander
31.03.2017
14:46:39
Да, насчет дашбордов была дискуссия, открыли тикет

Alexander
31.03.2017
14:47:30
ну мне большего пока и не надо, сделают дашборды – будет счастье (и новые потребности)

Олег
31.03.2017
15:15:15
чего не хватает?

Google
Pavel
31.03.2017
15:15:42
все хватает :)

Konstantin
31.03.2017
15:17:53
какая бд лучше под пром? influx?

вопрос снят

Олег
31.03.2017
15:24:14
что выбрал?

Roman
31.03.2017
15:28:00
вопрос снят
О! Быстро.

Антон
31.03.2017
15:32:29
О! Быстро.
Вжух и готово )

Pavel
31.03.2017
15:44:16
под пром?

что такое пром?

Admin
ERROR: S client not available

User ?
31.03.2017
15:44:58
Konstantin
31.03.2017
15:53:31
у меня кстати вопрос , а есть ли где нибудь уже готовые .rules для алертов?

для пром

Maxim
31.03.2017
15:58:59
для алертов в вакууме?

Zhenia
31.03.2017
16:13:00
Алерт менеджера скорее всего

Konstantin
31.03.2017
16:33:51
Дада, я про него

Просто заметил что почти нету нигде готовых триггеров для алерт менеджера

Alexander
31.03.2017
16:40:52
у автора в блоге кой-чо есть

а так прям готовое сложно представить, проще на примерах научится и не бояться писать свои

Timur
01.04.2017
08:41:00
чет меня influx + telegraf за графаной реально пугать начали

на тестовых виртуалках (слабоватых, но все же), при retention policy на две недели, можно с дашборда спросить инфу за месяц и наблюдать следующие спецэфекты: - проц на виртуалке с инфлаксом улетает в потолок - в инфлаксе сыпяться server/client ошибки - (что самое неприятное) все это за собой тянет виртуалку, на которой стоит телеграф (собирая http статусы с ~80 хостов

Google
Timur
01.04.2017
08:46:05
это при том, что в обычном состоянии на виртуалках не более 5% cpu usage

Maxim
01.04.2017
09:18:27
прометей тоже нормально так пожевывает ;)

Timur
01.04.2017
10:21:02
с одной стороны не проблема иметь две разных базы, одну для графаны, другую для аналитических каких то целей с другой стороны если даже смена rp в таком случае не сильно спасает и есть возможность уронить не себя, а того кого ты мониторишь, то это ваще адово а в графане никак обрубить у вьюверов возможность спрашивать за большие интервалы времени нельзя?

стоит ретеншн на 62 дня, и когда прошу отрисовать борду за эти самые 2 месяца, пром жрёт много проца, в смысле весь, на тачке 12 цпу\24 гига
а борда рисовалась графаной? если в самом проме тот же запрос отрисовать попробовать также будет?

Anton
01.04.2017
10:42:00
если в самом проме прокрутить тот же запрос на такой же объём по времени

он отваливается по ТО, который в морде прома 30 сек

Timur
01.04.2017
11:41:53
типа "вы бы, сударь, конкретный диапазон указали, ато через 30 секунд пока я буду тупить над одним запросом, у меня второй такой же появиться"?

надо наверное в кои то веки код, что графаны, что бд покурить, неужто все только изза такой несогласованности во взаимодействии

Anton
01.04.2017
17:00:14
не, дефолтный в борде по моему час выбирается, если ты тыкаешь в graph

за час построить ок, а вот за 62 дня уже трудно, особенно если нужно делать бери все метрики за 5 минут, считай чтонибудь сложнее авеража, потом показывай

Timur
02.04.2017
07:28:41
за час построить ок, а вот за 62 дня уже трудно, особенно если нужно делать бери все метрики за 5 минут, считай чтонибудь сложнее авеража, потом показывай
В сутках 1440 минут, значит 288 пятиминутных интервалов. За 62 дня таких пятиминутных интервалов набирается 17856. Это в три раза больше, чем максимально возможное разрешения дисплея на сегодняшний момент.

Александр
02.04.2017
07:29:19
5 минут на 1 пиксель?

Timur
02.04.2017
07:33:40
Мой посыл в том, что если ты графики строишь для периода 62 дня, нет смысла минимальный период агрегирования делать меньше 1-2 часов.

User ?
02.04.2017
11:15:07
Подскажите, есть ли разница под ELK в фс? xfs vs ext4?

Алексей
02.04.2017
11:17:09
да. особенно для кибаны.

User ?
02.04.2017
11:18:47
elasctic основную нагрузку давать будет же

Страница 134 из 681