
Stannis
12.12.2017
06:34:48
Точно... именно это в башне и написано )
пардон

Dmitry
12.12.2017
06:34:55
при сборе метрик учавствуют discovery, sae, activator и chwriter

Ivan
12.12.2017
06:36:26
это только половина правды ?
Скажи, а сислог и трап будут резервироваться, если их на разных машинах запускатть, но слать события на оба? Что будет? Клоны аварий?

Stannis
12.12.2017
06:36:39

Google

Stannis
12.12.2017
06:36:53
Все таски же в nsqd ?

Ilya
12.12.2017
06:37:12

Stannis
12.12.2017
06:37:59
Есть, но интересно именно межпроцессовое взаимодействие

Dmitry
12.12.2017
06:39:17
ping генерирует метрики, да
активатор, кстати, тоже может ?
кто хочет мониторить PMTU до железки и tcp retransmit/tcp rtt на cli?

Stannis
12.12.2017
06:40:58
Кстати насчёт cli
а можно собирать метрики через cli?
Не SNMP а именно cli

Ilya
12.12.2017
06:42:58
На проблему встали?
Сеть то большая ;)

Google

Dmitry
12.12.2017
06:43:43
нет, не смотрели еще в эту сторону
но я сталкиивался с внезапным занижением MTU на арендованных каналах

Ilya
12.12.2017
06:44:28

Dmitry
12.12.2017
06:44:35
хорошо, что есть привычка isis с padding'ом гонять
Ж)

Ilya
12.12.2017
06:44:54
Мы ещё мплс гоняем через них

Dmitry
12.12.2017
06:46:12
я тоже гонял
там и заметно было

Ivan
12.12.2017
06:47:01

Dmitry
12.12.2017
06:47:27
выжрет кучу проца и дедуплицирует

Ivan
12.12.2017
06:49:42

Ilya
12.12.2017
06:50:12
ТЗ в некоторых местах кривое было, операторы не могли ничего сделать, т.к. не мы заказывали канал.. ПРиходлось MSS понижать

Dmitry
12.12.2017
06:53:18
ну вот подумать нужно
"tcpi_state",
"tcpi_ca_state",
"tcpi_retransmits",
"tcpi_probes",
"tcpi_backoff",
"tcpi_options",
"tcpi_snd_rcv_wscale",
"tcpi_rto",
"tcpi_ato",
"tcpi_snd_mss",
"tcpi_rcv_mss",
"tcpi_unacked",
"tcpi_sacked",
"tcpi_lost",
"tcpi_retrans",
"tcpi_fackets",
# Times
"tcpi_last_data_sent",
"tcpi_last_ack_sent", # /* Not remembered, sorry. */
"tcpi_last_data_recv",
"tcpi_last_ack_recv",
# Metrics
"tcpi_pmtu",
"tcpi_rcv_ssthresh",
"tcpi_rtt",
"tcpi_rttvar",
"tcpi_snd_ssthresh",
"tcpi_snd_cwnd",
"tcpi_advmss",
"tcpi_reordering",
то, что есть в TCP info
из хорошего -- снимается просто с сокета CLI

Stannis
12.12.2017
06:54:46
А это как лечить?

Dmitry
12.12.2017
06:55:13
миграцией

Google

Stannis
12.12.2017
06:56:14
./noc migrate ?
Running migrations for main:
- Nothing to migrate.
Running migrations for project:
- Nothing to migrate.
Running migrations for wf:
- Nothing to migrate.
Running migrations for gis:
- Nothing to migrate.
Running migrations for crm:
- Nothing to migrate.
Running migrations for inv:
- Nothing to migrate.
Running migrations for sa:
- Nothing to migrate.
Running migrations for fm:
- Nothing to migrate.
Running migrations for pm:
- Nothing to migrate.
Running migrations for cm:
- Nothing to migrate.
Running migrations for ip:
- Nothing to migrate.
Running migrations for vc:
- Nothing to migrate.
Running migrations for dns:
- Nothing to migrate.
Running migrations for peer:
- Nothing to migrate.
Running migrations for kb:
- Nothing to migrate.
? You have no migrations for the 'support' app. You might want some.
Running migrations for sla:
- Nothing to migrate.
Running migrations for phone:
- Nothing to migrate.


Ivan
12.12.2017
06:57:18
Ты точно инсталл олл делаешь?

Dmitry
12.12.2017
06:57:49
@somovis вот ретрансмиты и pmtu вполне можно сбрасывать
да и объемы переданных данных

Stannis
12.12.2017
06:58:08

Ilya
12.12.2017
06:58:46
"tcpi_state",
"tcpi_ca_state",
"tcpi_retransmits",
"tcpi_probes",
"tcpi_backoff",
"tcpi_options",
"tcpi_snd_rcv_wscale",
"tcpi_rto",
"tcpi_ato",
"tcpi_snd_mss",
"tcpi_rcv_mss",
"tcpi_unacked",
"tcpi_sacked",
"tcpi_lost",
"tcpi_retrans",
"tcpi_fackets",
# Times
"tcpi_last_data_sent",
"tcpi_last_ack_sent", # /* Not remembered, sorry. */
"tcpi_last_data_recv",
"tcpi_last_ack_recv",
# Metrics
"tcpi_pmtu",
"tcpi_rcv_ssthresh",
"tcpi_rtt",
"tcpi_rttvar",
"tcpi_snd_ssthresh",
"tcpi_snd_cwnd",
"tcpi_advmss",
"tcpi_reordering",
"tcpi_snd_mss",
"tcpi_rcv_mss",
Может пригодится для определения неправильной настройки с двух сторон, между узлами

Stannis
12.12.2017
07:00:21
А для 3х инстансов с базами данных нужен HAP?
У меня ощущение, что базы не синхронизированны

Ivan
12.12.2017
07:03:58
Зачем ты два раза делаешь это?

Stannis
12.12.2017
07:04:31
да, видимо зря...
File "/opt/noc/lib/python2.7/site-packages/pymongo/helpers.py", line 314, in _check_write_command_response
raise DuplicateKeyError(error.get("errmsg"), 11000, error)
pymongo.errors.DuplicateKeyError: E11000 duplicate key error collection: noc.noc.pools index: name_1 dup key: { : "P0001" }
Чёт видимо, пока, рано много машин...
Сделаю новую инсталляцию на 1+2активатора+4кликхауса

Ivan
12.12.2017
07:11:37
Четыре кликхаус?
Ты наркоман?

Stannis
12.12.2017
07:18:26

Ilya
12.12.2017
07:20:19
"tcpi_state",
"tcpi_ca_state",
"tcpi_retransmits",
"tcpi_probes",
"tcpi_backoff",
"tcpi_options",
"tcpi_snd_rcv_wscale",
"tcpi_rto",
"tcpi_ato",
"tcpi_snd_mss",
"tcpi_rcv_mss",
"tcpi_unacked",
"tcpi_sacked",
"tcpi_lost",
"tcpi_retrans",
"tcpi_fackets",
# Times
"tcpi_last_data_sent",
"tcpi_last_ack_sent", # /* Not remembered, sorry. */
"tcpi_last_data_recv",
"tcpi_last_ack_recv",
# Metrics
"tcpi_pmtu",
"tcpi_rcv_ssthresh",
"tcpi_rtt",
"tcpi_rttvar",
"tcpi_snd_ssthresh",
"tcpi_snd_cwnd",
"tcpi_advmss",
"tcpi_reordering",
"tcpi_snd_rcv_wscale" - иногда полезно, иногда нет.
Метрики можно собирать любые, дальше каждый выберет сам что нужно, а что нет

Dmitry
12.12.2017
07:22:07
часть не нужна

Stannis
12.12.2017
07:32:02

Google

Ilya
12.12.2017
07:32:21

Stannis
12.12.2017
07:32:42
зачем*

E_zombie
12.12.2017
07:46:19
наркоманы

Ivan
12.12.2017
07:46:36
и ты

Ilya
12.12.2017
07:46:50

Wingman
12.12.2017
07:46:53

Ivan
12.12.2017
07:47:20

Stannis
12.12.2017
07:52:43
А что вместо PG планируется? Перечитал историю чатика не особо понял
Таки ошибка впоследней версии башни ((
DuplicateKeyError(error.get("errmsg"), 11000, error) pymongo.errors.DuplicateKeyError: E11000 duplicate key error collection: noc.noc.pools index: name_1 dup key: { : "P0001" }

Admin
ERROR: S client not available

Stannis
12.12.2017
07:55:32
Я на git_migrate
Это правильно?

Ivan
12.12.2017
07:57:01

Stannis
12.12.2017
07:57:12
эту ошибку как пофиксил?

Ilya
12.12.2017
07:58:40

Stannis
12.12.2017
07:59:05
Понятия не имею
Деплою из башни новую инсталляцию

Ilya
12.12.2017
07:59:27
Андрея лучше попроси, не могу сказать
Искать надо
Тут в поиске где-то есть

Google

Stannis
12.12.2017
07:59:43
Ага, поищу
спасибо

Алексей
12.12.2017
08:02:36
Stan, дропай все.
4 кх это примерно 200к+ железа
Тебе нужен один или максимум 2

Stannis
12.12.2017
08:03:29

Алексей
12.12.2017
08:03:31
Дб сервера оставь 1
Дббл это балансер?

Stannis
12.12.2017
08:04:12
да

Алексей
12.12.2017
08:04:18
Выбрасывай
Нечего там ещё балансить
Ты такое собрал почитав мою доку по масштабированию?

Stannis
12.12.2017
08:05:22
Тогда я пришёл к следующему:
1 х Главная нода с базами и монгами
2 х КХ
2 х Активатора
2 х Дисковерера
1 х WWW

Алексей
12.12.2017
08:05:51
Два кх зачем?
Резервирование?
Если да где другие резервы?
Если нет то нафиг

Stannis
12.12.2017
08:06:46
Шарда+репилка

Алексей
12.12.2017
08:06:56
Зачем?
Её надо обслуживать и деплой не собирает эту схему

Stannis
12.12.2017
08:07:22
Ну метрики это святое, их терять в последнюю очередь хочется )

Алексей
12.12.2017
08:07:29
Ее надо делать руками