
Ivan
06.10.2016
21:10:42
приятных

Ilya
06.10.2016
21:10:46
Спасибо
На ночь

Andrey
06.10.2016
21:11:10
вау.....

Google

Ilya
06.10.2016
21:11:13
Всем ночи

Andrey
06.10.2016
21:11:16
ужасы на ночь
приятных

Ivan
06.10.2016
21:11:33
Вообще, Mnitor на вкладке SA бесполезен в микросервисах, т.к. нифига не показывате

Dmitry
06.10.2016
21:11:46
его просто нужно убрать

Ivan
06.10.2016
21:11:54
ну да, а то смущает

Dmitry
06.10.2016
21:12:01
они все отдают в графану

Andrey
06.10.2016
21:12:19
не надо, у него иконка красивая
пусть как украшение будет

Ivan
06.10.2016
21:12:32
^__^

Andrey
06.10.2016
21:12:44
а то папки одни, скучно так

Ivan
06.10.2016
21:12:59
Андрей, а по бок-дискавери можно все в ран-статусе вывести?
похоже, они реально зависли

Google

Andrey
06.10.2016
21:13:38
в каком плане все вывести в РАН? одномоментно нельзя
последовательно можно
там такая фишка.... ими рулит шедулер

Ivan
06.10.2016
21:14:03
я вот про
это: "Посмотри сколько box в run"

Andrey
06.10.2016
21:14:15
кнопкой плай в интерфейсе ты просто смещаешь начало задачи на пораньше
но от этого ими не перестаёт рулить шедулер:)

Ivan
06.10.2016
21:14:29
да, это шедулинг, понятно

Andrey
06.10.2016
21:14:36
если свободных активаторов нет - то фиг тебе

Dmitry
06.10.2016
21:14:41
из cli -- запустится без scheduler'а
и сразу

Andrey
06.10.2016
21:14:51
из кли запускается только по порядку

Ivan
06.10.2016
21:15:00
у меня просто в running_tasks постоянно одно и то же число +-1

Andrey
06.10.2016
21:15:00
одна штука в один момент

Ivan
06.10.2016
21:15:35
было же такое, что железки зависали в статусе Run на box-discovery
вот кол-во таких зависших мжно найти?

Andrey
06.10.2016
21:17:23
условно можно. Надо обойти задачи, которые в состоянии Run и найти разницу между временем старта и текущим.
если разница будет больше некого числа - например 1 дня
то вот он:) наш зомби

Ivan
06.10.2016
21:17:56
можно его прибивать будет

Google

Dmitry
06.10.2016
21:18:07
выстрелом в голову

Andrey
06.10.2016
21:18:14
да, там надо удалить из базы и добавить заново

Ivan
06.10.2016
21:18:17
я чисто теоретически могу всех сделать Unmanagement и потом обратно

Andrey
06.10.2016
21:18:18
задачку

Ivan
06.10.2016
21:18:22
но это так себе приколы

Andrey
06.10.2016
21:18:24
не поможет

Ivan
06.10.2016
21:18:29
фак

Andrey
06.10.2016
21:18:38
делание Unmanaged не убирает задачу из БД

Ivan
06.10.2016
21:18:45
Помогайте, ребята

Andrey
06.10.2016
21:19:33
а что случилось? думаешь, много зомби?

Ivan
06.10.2016
21:19:55
Похоже, что 50 =)
я просто не понмаю, чем ограничено это число

Andrey
06.10.2016
21:20:25
ну... я ещё не в курсе изысканий...
вы тут уже второй день) в поисках чисел
50 - это количество запущенных заданий в дискавери?

Ivan
06.10.2016
21:21:51
строчка в вебе /inv/monitor/
у тебя такое есть?)

Andrey
06.10.2016
21:22:26
может и есть) на данный момент свой дискавери я сломал

Ivan
06.10.2016
21:22:29
{"late_tasks": 636, "running_tasks": 51, "total_tasks": 1386, "pool": "default", "lag": 1529.564308}

Andrey
06.10.2016
21:22:36
у меня всё руки не доходят в них разобраться

Google

Ivan
06.10.2016
21:22:46
и вот этот вот 50-51 не меняется вообще
для начала хочу понять, почему и чем он ограничен

Andrey
06.10.2016
21:23:16
такс... это надо в шелл лезть.

Ivan
06.10.2016
21:23:27
там темно
мне, по крайне мере

Andrey
06.10.2016
21:24:31
счас глянем, была где-то заметка
когда ковырялся с этим
в общем, поступим проще
подключайся к монге
сможешь?

Ivan
06.10.2016
21:33:10
Конечно

Andrey
06.10.2016
21:33:36
там запрос
db.noc.schedules.discovery.default.find({"s":"R"}).count()
default - Это название пула

Ivan
06.10.2016
21:35:00
sudo -u noc mongo
верно?

Andrey
06.10.2016
21:36:27
mongo --host 127.0.0.1 -u noc -p -authenticationDatabase noc noc

Ivan
06.10.2016
21:37:07

Andrey
06.10.2016
21:38:22
о) вот и наша цифра

Ivan
06.10.2016
21:38:32
а что это в итоге?
s и R статусы?

Google

Ivan
06.10.2016
21:38:57
или state = running?

Andrey
06.10.2016
21:39:09
да
R - Running
ls - last state
db.noc.schedules.discovery.default.find({"s":"R"}, {"ts": 1})
ts = time start

Ivan
06.10.2016
21:41:10
http://pastebin.com/n5yXaXgG
по факту все недавно стартовали
но я деплой делал
примерно тогда
щас uptime 0:44:26

Andrey
06.10.2016
21:42:56
3 штуки зависших я вижу
счас время посчитаем

Ivan
06.10.2016
21:43:03
у процессов в supervisord

Andrey
06.10.2016
21:43:10
с прошлого месяца

Ivan
06.10.2016
21:43:27
А, 09, вижу
Даа, хост по objectid что-то не угадывается
всё равно, значит число одновременных задач чем-то ограничено

Andrey
06.10.2016
21:47:20
это не хоста
это задачи

Ivan
06.10.2016
21:47:50