@metrics_ru

Страница 178 из 681
Andor
13.06.2017
14:02:03
с нашими патчами

Andrey
13.06.2017
14:02:33
а есть преимущество в использовании телеграфа вместо нод-экспортера например

я ж правильно понимаю что телеграф едет на ноду?

Google
Алексей
13.06.2017
14:04:21
это единственное преимущество

Andrey
13.06.2017
14:04:22
поясни пожалуйста

а недостатки?

Алексей
13.06.2017
14:04:42
это продукт от компании influxdata

Andrey
13.06.2017
14:04:54
и почему тогда prometheus а не influxdb с которым они разрабатываются?

это продукт от компании influxdata
а это теперь недостаток?

я чот пропустил :(

Алексей
13.06.2017
14:05:17
а это теперь недостаток?
да. они не умеют программировать.

lastsky
13.06.2017
14:05:57
а есть преимущество в использовании телеграфа вместо нод-экспортера например
node_exporter - это pure server metrics. включил коллекторы и получаешь нормально telegraf - это хитрая херня в которой можно включить только нужные плагины, например, собирать mysql, собирать nginx, собирать http response. он скриптуется, катится ансиблом и без особых проблем это всё запускается с полпинка просто на другом порту.

если telegraf'ом собирать всё - то он сожрет слишком много памяти. как касперский, чтобы не дать вирусам работать.

Алексей
13.06.2017
14:06:33
телеграф хороший скорее чем плохой.

но бывает бажный.

народ на него ругается переодически. но на мой взгляд поводы для ругани так себе.

Google
lastsky
13.06.2017
14:07:12
вот именно. поэтому business-critical метрики собирать им - да нахер он пошёл.

Andrey
13.06.2017
14:08:44
короче телеграф vs node_exporter это что-то вроде zabbix vs icinga2?

Алексей
13.06.2017
14:09:04
нет.

как можно заббикс с чем то кроме null сравнивать ?

lastsky
13.06.2017
14:10:44
node_exporter vs telegraf это как nginx и apache

не только с null

Juff
13.06.2017
14:12:04
щас чуствую пойдет срач на мой любимый нагиос тоже

Alexander
13.06.2017
14:12:16
не надо срача

Александр
13.06.2017
14:14:14
?

щас чуствую пойдет срач на мой любимый нагиос тоже
nagios вообще норм, только в приготовлении он сложнее сраббикса

Алексей
13.06.2017
14:15:01
Ну как это, у null нет web-ui
https://devnull-as-a-service.com

Почти

lastsky
13.06.2017
14:15:25
"сдам место в /var/tmp/" (c)

Александр
13.06.2017
14:16:14
Всё бы вам по зубокскалить

We’re a young and dynamic team of messy data-scientists who have failed at being employed on the real market.(с) это относится к 99% стартапов

А эти хоть молодцы не боятся

Andor
13.06.2017
14:26:21
а недостатки?
не очень стабилен не заточен под прометей (некоторые метркии просто игнорируются, если тип не числовой)

с поддержкой прометея было немало проблем, какие-то починены, какие-то нет

Google
lastsky
13.06.2017
14:59:50
Andor
13.06.2017
17:46:09
привет, Дима

lastsky
13.06.2017
18:11:48
Чет там всего много но как то по чуть чуть
ну да. везде свои баги ещё. а что-то вообще непригодно.

если мы про telegraf

например, они снова сломали аэроспайк, спасибо им )

а консул так и не починили, тоже спасибо

шикарно. мне тут подкинули стикеры, давайте замутим полный набор церквистов )

Zhenia
13.06.2017
18:22:20
а кого считать прихожанами?

Vladimir
13.06.2017
18:23:10
Всех :)

lastsky
13.06.2017
18:23:19
тут сидит какой-то хуебот который считает слова вроде. stat сделать, первую десятку можно наверное считать

/stat@combot

Combot
13.06.2017
18:23:27
combot.org/chat/-1001068522817

Zhenia
13.06.2017
18:24:21
не, первая десятка это проповедники

Sheridan
13.06.2017
18:28:10
счастья всем

Mi
13.06.2017
18:28:20
Всех :)
Доброго времени суток Владимир! Подскажите пожалуйста, есть ли уже в паблике Ваш доклад по сбору миллионов метрик с использованием графита?

Zhenia
13.06.2017
18:31:30
блин, мне больше интересно как народ забиксом собирает метрики с огромных ферм

Sheridan
13.06.2017
18:32:14
не напоминайте мне про заббикс

Zhenia
13.06.2017
18:32:32
ну, могу логи поискать, где ты говорил что заббикс норм

и плевать чем снимать метрики

Google
Sheridan
13.06.2017
18:32:51
мунин норм жэ

lastsky
13.06.2017
18:33:15
с точки зрения ОС

Sheridan
13.06.2017
18:33:36
а чем огромные фермы отличаются от много 1u серверов?
тем что заббикс здыхает на третьем 1у

Admin
ERROR: S client not available

lastsky
13.06.2017
18:33:45
1m!

Zhenia
13.06.2017
18:34:03
да ничем, но большинство людей с много 1u снимает метрики раз в минуту, а не раз в 5 секунд

Sheridan
13.06.2017
18:34:12
я както мониторил заббиксом свичи в сети прова

жопа. лишь на 2х ссд в рейд0 оно на тюнингованном мускуле болееменее взлетело с несколькими сотнями свичей

lastsky
13.06.2017
18:35:10
хотя я вот подумал, что модуль sensors будет выдавать же одинаковые напряжения и fan speed. это же blade архитектура где общее всё типа питания, охлаждения, итд

lastsky
13.06.2017
18:37:28
микроберсты ловить?

Zhenia
13.06.2017
18:37:46
ага

если летенси раз в минуту на 5 секунд скачет, etc

Sheridan
13.06.2017
18:38:28
а раз в 5 секунд есть смысл снимать?
не спорь. Основная идея "мы лучше зохаваем терабайты под статистику, и потом сразу найдем точку если вдруг авария чем ловить эту точку при необходимости

Google
lastsky
13.06.2017
18:39:36
не спорь. Основная идея "мы лучше зохаваем терабайты под статистику, и потом сразу найдем точку если вдруг авария чем ловить эту точку при необходимости
я бы под такое отдельные инстансы telegraf запустил которые мне latency до узла измеряют, и фильтр на входе в прометей поставил, чтобы не хавать терабайты. а обычные метрики бы снимал как обычно.

че спорить ) есть терабайты - пусть потом плачут сами в прометей "сделайте нам нормальный интерфейс для удаления ненужных метрик"

Sheridan
13.06.2017
18:40:37
я бы под такое отдельные инстансы telegraf запустил которые мне latency до узла измеряют, и фильтр на входе в прометей поставил, чтобы не хавать терабайты. а обычные метрики бы снимал как обычно.
в том то и дело, что надо подходить к вопросу шагом а не бегом. Подумать какие метрики надо часто, какие редко, какие чуть ли не вручную.

и так для каждой (!) цели

ну в смысле для каждого сервиса

lastsky
13.06.2017
18:41:27
и вообще для этого надо в федерацию прометей сделать с маленьким scrape и месяцом ротации, и нормально будет :)

но да, кейс интересный. мы над ним думали, только в других масштабах.

Zhenia
13.06.2017
18:47:52
ну, вот прибегают юзеры , ноют что играть невозможно, спайки лаги

каждый день прибегают

Andor
13.06.2017
18:48:07
т.е. например можно чтобы он мерял сетевую латентность каждую секунду

а в прометей уже гистограмма улетала

Zhenia
13.06.2017
18:48:33
и пойди найди, проблема в их канале, твоем внешнем, лаже внутри сети или где-то шина охуела от количества сообщений на пару секунд

такая статистика исключительно оперативная и нужна за последнюю неделю

так что там нету террабайт данных

если интересно - вечером посмотрю

Страница 178 из 681