
Ilya
19.10.2016
10:35:10
На новой инсталяции буду пробовать

Алексей
19.10.2016
10:35:31
@EKbfh у тя на картинке какая то странность
https://kb.nocproject.org/download/attachments/24936479/image2016-10-18%2012%3A1%3A9.png?version=1&modificationDate=1476781305246&api=v2
раннинг тасков слишком много

Google

Ivan
19.10.2016
10:36:02

Алексей
19.10.2016
10:36:36
у меня на такую систуацию мониторинг бы встал на дыбы

Ivan
19.10.2016
10:37:10

Алексей
19.10.2016
10:37:22
(httpjson_inv_monitor_running_tasks{env="prod"} + httpjson_inv_monitor_late_tasks{env="prod"}) > (httpjson_inv_monitor_total_tasks{env="prod"} / 300) * 10
формула означает пиздец.

Ivan
19.10.2016
10:38:14
куда её вводить?

Алексей
19.10.2016
10:38:17
никуда.
прикинь по ней

Ivan
19.10.2016
10:39:05
нужно просто настроить нок, чтобы не было такого
Вот box discovery
можно сделать его 10 минут
но нагружают-то периодики

Ilya
19.10.2016
10:41:27
@freeseacher как поживает playbook? :)

Google

Алексей
19.10.2016
10:41:47
пока деплой падает.

Ivan
19.10.2016
10:42:03

E_zombie
19.10.2016
10:43:07
два чая данному господину

Алексей
19.10.2016
10:43:21
он так стартует после длительного простоя

Ivan
19.10.2016
10:43:57
он не лошадь, он верблюд, который лошадь
Ты вообще понял, что написал?

Алексей
19.10.2016
10:44:10
да понял :)
ну вот с 11:20 на картинке я предполагаю что ты считаешь что это устоявшееся поведение.
но это не оно
там должно быть падение до 2-3 задач в секунду
а у тя 500...
что бы такое поведение было оправданым надо что бы у тя был даунтайм в сутки примерно
и даже в этом случае.... надо считать короч

Ivan
19.10.2016
10:47:40

Алексей
19.10.2016
10:48:02
потому что у тя переодические таски должны только работать.
а их 800/300

Ivan
19.10.2016
10:48:15
Я считаю. если lag ~0 и в late_tasks 0, значит всё заебись

Алексей
19.10.2016
10:48:31
ибо бокс у тя отрабатывает раз в сутки
800/86400 не имеет сколь значимой цифры

Google

Ivan
19.10.2016
10:50:56
Ок, тогда откуда у меня столько задач

Алексей
19.10.2016
10:51:19
дибаж чо

Ivan
19.10.2016
10:51:45
а их 800/300
ты не учитываешь время выполнения тасков, так-то

Алексей
19.10.2016
10:51:58
тут кажется @aversant кидал запрос в монгу
который показывает какие задачи сейчас в running
и надо дать еще 2-3 часа
через два три часа у тя должно быть 2-3 задачи в секунду.

Ivan
19.10.2016
10:52:48

Алексей
19.10.2016
10:52:51
больше - плохо что то идет не так
12 часов да

Ivan
19.10.2016
10:52:57
Ок, что?

Алексей
19.10.2016
10:53:12
можно выкинуть из уровнения временя выполнения тасков
они все выполнены и перевыполнены
смотри что у тя в этом списке.
может у тя часть железяк не пингается

Ilya
19.10.2016
10:53:47
@freeseacher запилите плейбуку :)

Алексей
19.10.2016
10:53:48
или не опрашиваются

Ilya
19.10.2016
10:57:34
надеюсь не sla :)

Google

Алексей
19.10.2016
10:57:44
никогда не угодаешь :)

E_zombie
19.10.2016
10:59:31
а что у нас значит параметр "IP ToS mark" для пингователя?

Алексей
19.10.2016
11:00:52
битики какие выставлять
для приоритезации пакетиков

Ilya
19.10.2016
11:01:45
в смысле он сам красит ицмп перед вылетом?
Прикольно.

Ivan
19.10.2016
11:07:15
просто не ясно, что такое running_tasks

Алексей
19.10.2016
11:08:55
раннинг это те у которых стоит признак R монге
я говорю же @aversant кидал запрос каким смотреть
db.noc.schedules.discovery.default.find({"s":"R"}, {"key":1, "ts": 1})

Ivan
19.10.2016
11:09:35
в наверное уде 15 раз.
механика такая
шедулер проверяет mo profile и конвертирует раз в 5 минут в конкретное время.
это конкретное время он кладет в монгу
задачи у которых время запуска находится в прошлом - читает дискавери
дискавери идет к сае и добывает активтаор и логопас.
потом дискавери идет к активатору
перед тем как пойти к активатору он говорит я таск взял
это становится раннинг таском
те что не взяты late
дальше активатор отрабатывает задание.

Google

Ivan
19.10.2016
11:09:35
и отдает его обратно дискавери
дискавери проверяет задание и говорит что оно комплит
#faq Список запущенных задач https://kb.nocproject.org/pages/viewpage.action?pageId=24936488
посмотри, что не так тогда

Bitbucket
19.10.2016
11:47:25
Dmitry Volodin pushed to noc/feature/microservices
./noc escalation run

Ivan
19.10.2016
11:49:08
Дима

Ilya
19.10.2016
11:50:18
@dvolodin когда?

kk
19.10.2016
11:54:41
хе-хе
centos7 : ok=224 changed=83 unreachable=0 failed=0
только это с форка

Алексей
19.10.2016
11:55:11
запилил пгбаунсер ?

kk
19.10.2016
11:55:52
если кому ну очень срочно. могу дать линк. потом должно нормально перейти на офф ветку

Bitbucket
19.10.2016
12:07:29
Andrey pushed to noc/feature/microservices
Migrations commits come back

Dmitry
19.10.2016
12:08:43
Commits stike back :)

E_zombie
19.10.2016
12:13:44
fuck yeeeaaaa!!!

Ilya
19.10.2016
12:17:56
@dvolodin когда запилите?

Bitbucket
19.10.2016
12:18:02
Andrey pushed to noc/feature/microservices
Revert customerID transaction

Maksim
19.10.2016
12:38:24
а VC не ломали случаем ?