@metrics_ru

« Назад

Страница 134 из 681

Далее »

Михаил

30.03.2017
11:09:49

можно усредненное

Zhenia

30.03.2017
11:10:00

rate(node_network_transmit_packets[30s])/30

но толку от такой метрики, я не понимаю

Paul

30.03.2017
11:12:06

я хочу pps

что тебе мешает снимать раз в 30 секунд? полученую цифру делишь на 30 и получаешь средний ппс

Google

Михаил

30.03.2017
11:13:32

да вот я сижу и туплю, как мне нормально снимать параметр PPS

Pavel

30.03.2017
11:16:52

с ifconfig ну либо с /proc

у меня в бложике было, щаз найду

https://www.stableit.ru/2014/08/pps.html

прошу

Paul

30.03.2017
11:17:46

да вот я сижу и туплю, как мне нормально снимать параметр PPS

тебе нужно снимать PPS не каждую секунду а с определенной точностью. Подумай о том, какая точность тебе нужна. Для трендов 30 секунд достаточно. В редчайших случаях нужна точность в 5-10 секунд на измерение, но это прям реально редкость

Pavel

30.03.2017
11:18:09

pps это крайне важная характеристика

размывать ее по 30 секундам бессмысленная трата времени.

оно должно считаться по секундам, если хочется получить что-то полезное (микроберсты? ддосы?)

Paul

30.03.2017
11:19:13

никто не спорит, но нужно понимать, какая точность необходима. Точность стоит дорого, и чем выше точность - тем дороже это будет. Точность в 100мс - это боль. Над точностью в 10мс у нас целый отдел воевал как-то

Pavel

30.03.2017
11:19:59

кто ж говорит про миллисекунды) секунды - ОК

Dmitry

30.03.2017
11:21:11

смотря для каких целей PPS измерять

если микроберсты ловить - то и секунды слишком грубо

Google

Pavel

30.03.2017
11:22:39

проще воткнуть везде десятки, чем их ловить :)

ну или 100GE, сразу.

Paul

30.03.2017
11:22:58

ну или 100GE, сразу.

очень дорого

Vladimir

30.03.2017
11:23:15

Если микроберсты, то мне кажется надо уже лезть в ядро, ловить нужные эвенты, сдать их в базу, а потом уже делать статистику

Pavel

30.03.2017
11:23:17

зато на вырост :)

Dmitry

30.03.2017
11:23:20

и как тебе десятки помогут?

Pavel

30.03.2017
11:23:38

запасом емкостей

Dmitry

30.03.2017
11:24:21

там буферы нужны, а не полоса

Pavel

30.03.2017
11:24:34

зависит от задач и причины появления берстов

Dmitry

30.03.2017
11:25:14

я про то, что с секундным интервалом на pps уже ничего не видно будет

Pavel

30.03.2017
11:25:31

все же от задачи зависит. ддос - будет видно, микроберст - вряд ли.

откуда мне знать чего автор добивается? :)

мы вообще наносекунды храним для pps, но это же не повод, правда? :)

Zhenia

30.03.2017
11:43:22

а для чего, если не секрет

Pavel

30.03.2017
11:43:34

у нас DDoS сенсор

трафика нередко под 100 миллионов пакетов секунду, поэтому нужна высокая точность, чтобы найти зловредный поток / пакет

Михаил

30.03.2017
11:45:16

проще воткнуть везде десятки, чем их ловить :)

и так десятки)

автор хотел посмотреть примерные PPS

сколько сети потребляет 5 виртулок например

Pavel

30.03.2017
11:49:03

тогда 30 секунд ОК :)

Google

Михаил

30.03.2017
12:24:27

тогда 30 секунд ОК :)

то есть если мне отдается значение 20к то это 20к пакетов за 30 секунд получается?

Pavel

30.03.2017
12:24:41

угу

Олег

31.03.2017
13:51:04

кто знает, как создать организацию в графане через API?

добыл себе апи ключик, подключаюсь, а оно мне аксес денаед

логинюсь под глобальным админом

http-авторизация которую где-то рекомендовали не проходит

вопрос снят, wget не отправлял http-auth

Pavel

31.03.2017
14:25:02

а планов норм апи на го сделать нету?

я вот юзера хочу создавать, датасорс раскатывать и дашборды импортировать не вовлекая юзера

Alexander

31.03.2017
14:42:34

графана очень плохо автоматизируема на данный момент, к сожалению

Daniel

31.03.2017
14:43:29

графана очень плохо автоматизируема на данный момент, к сожалению

но нет же выбора, выбора же нет :(

lastsky

31.03.2017
14:43:42

графана очень плохо автоматизируема на данный момент, к сожалению

недостаточно боли в голосе. недостаточно.

Alexander

31.03.2017
14:44:54

графана очень плохо автоматизируема на данный момент, к сожалению

Вы именно про возможности API?

Alexander

31.03.2017
14:45:05

выбора нет, но надо понимать что это оупенсорц, какие претензии – не нравится, пишем пропозалы, и может быть пишем такое нужное API

Вы именно про возможности API?

ну общее впечатление такое, те же дашбоды самый удобный способ установки для них – ручной

вот и товарищи выше подтверждают

Alexander

31.03.2017
14:46:39

Да, насчет дашбордов была дискуссия, открыли тикет

Alexander

31.03.2017
14:47:30

ну мне большего пока и не надо, сделают дашборды – будет счастье (и новые потребности)

Олег

31.03.2017
15:15:15

я вот юзера хочу создавать, датасорс раскатывать и дашборды импортировать не вовлекая юзера

юзер - check датасорс - check дашбоард - check

чего не хватает?

Google

Pavel

31.03.2017
15:15:42

все хватает :)

Konstantin

31.03.2017
15:17:53

какая бд лучше под пром? influx?

вопрос снят

Олег

31.03.2017
15:24:14

что выбрал?

Roman

31.03.2017
15:28:00

вопрос снят

О! Быстро.

Антон

31.03.2017
15:32:29

О! Быстро.

Вжух и готово )

Pavel

31.03.2017
15:44:16

под пром?

что такое пром?

Admin

ERROR: S client not available

User ?

31.03.2017
15:44:58

что такое пром?

prometheus

Konstantin

31.03.2017
15:53:31

у меня кстати вопрос , а есть ли где нибудь уже готовые .rules для алертов?

для пром

Maxim

31.03.2017
15:58:59

для алертов в вакууме?

Zhenia

31.03.2017
16:13:00

Алерт менеджера скорее всего

Konstantin

31.03.2017
16:33:51

Дада, я про него

Просто заметил что почти нету нигде готовых триггеров для алерт менеджера

Alexander

31.03.2017
16:40:52

у автора в блоге кой-чо есть

а так прям готовое сложно представить, проще на примерах научится и не бояться писать свои

Timur

01.04.2017
08:41:00

чет меня influx + telegraf за графаной реально пугать начали

на тестовых виртуалках (слабоватых, но все же), при retention policy на две недели, можно с дашборда спросить инфу за месяц и наблюдать следующие спецэфекты: - проц на виртуалке с инфлаксом улетает в потолок - в инфлаксе сыпяться server/client ошибки - (что самое неприятное) все это за собой тянет виртуалку, на которой стоит телеграф (собирая http статусы с ~80 хостов

Google

Timur

01.04.2017
08:46:05

это при том, что в обычном состоянии на виртуалках не более 5% cpu usage

Maxim

01.04.2017
09:18:27

прометей тоже нормально так пожевывает ;)

Vladimir

01.04.2017
10:06:19

на тестовых виртуалках (слабоватых, но все же), при retention policy на две недели, можно с дашборда спросить инфу за месяц и наблюдать следующие спецэфекты: - проц на виртуалке с инфлаксом улетает в потолок - в инфлаксе сыпяться server/client ошибки - (что самое неприятное) все это за собой тянет виртуалку, на которой стоит телеграф (собирая http статусы с ~80 хостов

У них похожее поведение с 0.7 тянется

Anton

01.04.2017
10:09:09

на тестовых виртуалках (слабоватых, но все же), при retention policy на две недели, можно с дашборда спросить инфу за месяц и наблюдать следующие спецэфекты: - проц на виртуалке с инфлаксом улетает в потолок - в инфлаксе сыпяться server/client ошибки - (что самое неприятное) все это за собой тянет виртуалку, на которой стоит телеграф (собирая http статусы с ~80 хостов

ну дак то же самое у меня с прометеем

стоит ретеншн на 62 дня, и когда прошу отрисовать борду за эти самые 2 месяца, пром жрёт много проца, в смысле весь, на тачке 12 цпу\24 гига

Timur

01.04.2017
10:21:02

с одной стороны не проблема иметь две разных базы, одну для графаны, другую для аналитических каких то целей с другой стороны если даже смена rp в таком случае не сильно спасает и есть возможность уронить не себя, а того кого ты мониторишь, то это ваще адово а в графане никак обрубить у вьюверов возможность спрашивать за большие интервалы времени нельзя?

стоит ретеншн на 62 дня, и когда прошу отрисовать борду за эти самые 2 месяца, пром жрёт много проца, в смысле весь, на тачке 12 цпу\24 гига

а борда рисовалась графаной? если в самом проме тот же запрос отрисовать попробовать также будет?

Anton

01.04.2017
10:42:00

если в самом проме прокрутить тот же запрос на такой же объём по времени

он отваливается по ТО, который в морде прома 30 сек

Timur

01.04.2017
11:41:53

типа "вы бы, сударь, конкретный диапазон указали, ато через 30 секунд пока я буду тупить над одним запросом, у меня второй такой же появиться"?

надо наверное в кои то веки код, что графаны, что бд покурить, неужто все только изза такой несогласованности во взаимодействии

Anton

01.04.2017
17:00:14

не, дефолтный в борде по моему час выбирается, если ты тыкаешь в graph

за час построить ок, а вот за 62 дня уже трудно, особенно если нужно делать бери все метрики за 5 минут, считай чтонибудь сложнее авеража, потом показывай

Timur

02.04.2017
07:28:41

за час построить ок, а вот за 62 дня уже трудно, особенно если нужно делать бери все метрики за 5 минут, считай чтонибудь сложнее авеража, потом показывай

В сутках 1440 минут, значит 288 пятиминутных интервалов. За 62 дня таких пятиминутных интервалов набирается 17856. Это в три раза больше, чем максимально возможное разрешения дисплея на сегодняшний момент.

Александр