
Andor
13.06.2017
14:02:03
с нашими патчами

Andrey
13.06.2017
14:02:33
а есть преимущество в использовании телеграфа вместо нод-экспортера например
я ж правильно понимаю что телеграф едет на ноду?

Алексей
13.06.2017
14:04:11

Google

Алексей
13.06.2017
14:04:21
это единственное преимущество

Andrey
13.06.2017
14:04:22
поясни пожалуйста
а недостатки?

Алексей
13.06.2017
14:04:42
это продукт от компании influxdata

Andrey
13.06.2017
14:04:54
и почему тогда prometheus а не influxdb с которым они разрабатываются?
я чот пропустил :(

Алексей
13.06.2017
14:05:17

lastsky
13.06.2017
14:05:57
а есть преимущество в использовании телеграфа вместо нод-экспортера например
node_exporter - это pure server metrics. включил коллекторы и получаешь нормально
telegraf - это хитрая херня в которой можно включить только нужные плагины, например, собирать mysql, собирать nginx, собирать http response. он скриптуется, катится ансиблом и без особых проблем это всё запускается с полпинка просто на другом порту.
если telegraf'ом собирать всё - то он сожрет слишком много памяти. как касперский, чтобы не дать вирусам работать.

Алексей
13.06.2017
14:06:33
телеграф хороший скорее чем плохой.
но бывает бажный.
народ на него ругается переодически. но на мой взгляд поводы для ругани так себе.

Google

lastsky
13.06.2017
14:07:12
вот именно. поэтому business-critical метрики собирать им - да нахер он пошёл.

Andrey
13.06.2017
14:08:44
короче телеграф vs node_exporter это что-то вроде
zabbix vs icinga2?

Алексей
13.06.2017
14:09:04
нет.
как можно заббикс с чем то кроме null сравнивать ?

lastsky
13.06.2017
14:10:44
node_exporter vs telegraf
это как
nginx и apache
не только с null

Juff
13.06.2017
14:12:04
щас чуствую пойдет срач на мой любимый нагиос тоже

Alexander
13.06.2017
14:12:16
не надо срача

Александр
13.06.2017
14:14:14
?

Алексей
13.06.2017
14:15:01
Почти

lastsky
13.06.2017
14:15:25
"сдам место в /var/tmp/" (c)

Александр
13.06.2017
14:16:14
Всё бы вам по зубокскалить
We’re a young and dynamic team of messy data-scientists who have failed at being employed on the real market.(с) это относится к 99% стартапов
А эти хоть молодцы не боятся

Andor
13.06.2017
14:26:21
а недостатки?
не очень стабилен
не заточен под прометей (некоторые метркии просто игнорируются, если тип не числовой)
с поддержкой прометея было немало проблем, какие-то починены, какие-то нет

Google

lastsky
13.06.2017
14:59:50

Andor
13.06.2017
17:46:09
привет, Дима

Dmitry
13.06.2017
18:11:10

lastsky
13.06.2017
18:11:48
если мы про telegraf
например, они снова сломали аэроспайк, спасибо им )
а консул так и не починили, тоже спасибо
шикарно. мне тут подкинули стикеры, давайте замутим полный набор церквистов )

Zhenia
13.06.2017
18:22:20
а кого считать прихожанами?

Vladimir
13.06.2017
18:23:10
Всех :)

lastsky
13.06.2017
18:23:19
тут сидит какой-то хуебот который считает слова вроде. stat сделать, первую десятку можно наверное считать
/stat@combot

Combot
13.06.2017
18:23:27
combot.org/chat/-1001068522817

Zhenia
13.06.2017
18:24:21
не, первая десятка это проповедники

Sheridan
13.06.2017
18:28:10
счастья всем

Mi
13.06.2017
18:28:20
Всех :)
Доброго времени суток Владимир! Подскажите пожалуйста, есть ли уже в паблике Ваш доклад по сбору миллионов метрик с использованием графита?

Zhenia
13.06.2017
18:31:30
блин, мне больше интересно как народ забиксом собирает метрики с огромных ферм

Sheridan
13.06.2017
18:32:14
не напоминайте мне про заббикс

Zhenia
13.06.2017
18:32:32
ну, могу логи поискать, где ты говорил что заббикс норм
и плевать чем снимать метрики

Google

Sheridan
13.06.2017
18:32:51
мунин норм жэ

lastsky
13.06.2017
18:33:15
с точки зрения ОС

Sheridan
13.06.2017
18:33:36

Admin
ERROR: S client not available

lastsky
13.06.2017
18:33:45
1m!

Zhenia
13.06.2017
18:34:03
да ничем, но большинство людей с много 1u снимает метрики раз в минуту, а не раз в 5 секунд

Sheridan
13.06.2017
18:34:12
я както мониторил заббиксом свичи в сети прова
жопа. лишь на 2х ссд в рейд0 оно на тюнингованном мускуле болееменее взлетело с несколькими сотнями свичей

lastsky
13.06.2017
18:35:10
хотя я вот подумал, что модуль sensors будет выдавать же одинаковые напряжения и fan speed. это же blade архитектура где общее всё типа питания, охлаждения, итд

Александр
13.06.2017
18:35:31

Sheridan
13.06.2017
18:35:43
Поня и ты тут
как минимум камнями различаццо будед

lastsky
13.06.2017
18:37:28
микроберсты ловить?

Zhenia
13.06.2017
18:37:46
ага
если летенси раз в минуту на 5 секунд скачет, etc

Vladimir
13.06.2017
18:38:06

Sheridan
13.06.2017
18:38:28
а раз в 5 секунд есть смысл снимать?
не спорь. Основная идея "мы лучше зохаваем терабайты под статистику, и потом сразу найдем точку если вдруг авария чем ловить эту точку при необходимости

Google

lastsky
13.06.2017
18:39:36
че спорить ) есть терабайты - пусть потом плачут сами в прометей "сделайте нам нормальный интерфейс для удаления ненужных метрик"

Sheridan
13.06.2017
18:40:37
и так для каждой (!) цели
ну в смысле для каждого сервиса

lastsky
13.06.2017
18:41:27
и вообще для этого надо в федерацию прометей сделать с маленьким scrape и месяцом ротации, и нормально будет :)
но да, кейс интересный. мы над ним думали, только в других масштабах.

Zhenia
13.06.2017
18:47:52
ну, вот прибегают юзеры , ноют что играть невозможно, спайки лаги
каждый день прибегают

Andor
13.06.2017
18:48:07
т.е. например можно чтобы он мерял сетевую латентность каждую секунду
а в прометей уже гистограмма улетала

Zhenia
13.06.2017
18:48:33
и пойди найди, проблема в их канале, твоем внешнем, лаже внутри сети или где-то шина охуела от количества сообщений на пару секунд
такая статистика исключительно оперативная и нужна за последнюю неделю
так что там нету террабайт данных
если интересно - вечером посмотрю