
Maksim
21.11.2016
10:13:48
кто может подсказать, дашбоард не всегда открывается на устройстве. Просто черный экран и все.

E_zombie
21.11.2016
10:13:48
@dvolodin у меня есть такой файлик limits.d/20-nproc.conf где * soft nproc 4096
root soft nproc unlimited
твою мать . ёбаный рхел
короче я не могу понять где оно выставляется. я уже что только не делал. всё равно техе самые параметры в логах

Google

E_zombie
21.11.2016
10:30:39
[root@nochost1 etc]# su - pgbouncer
Last login: Mon Nov 21 13:28:59 MSK 2016 on pts/1
[pgbouncer@nochost1 ~]$ ulimit -n
65535
короче это бага центоса. надо править pgbouncer.service
http://serverfault.com/questions/716982/how-to-raise-max-no-of-file-descriptors-for-daemons-running-on-debian-jessie
помогло да.

Dmitry
21.11.2016
11:19:28
может с мемкешем та же проблема?

E_zombie
21.11.2016
11:19:43
очень может быть

Maksim
21.11.2016
11:23:59
в краше кстати ругается на get_sla_probes

kk
21.11.2016
11:24:53

E_zombie
21.11.2016
11:26:34
http://pastebin.com/c57kUGAH это уже правленный
Type=forked
было в оригинале
## Add a service section and set the max number of open files
LimitNOFILE=12345
и вот этого не было

Google

kk
21.11.2016
11:27:34
ок.

Bitbucket
21.11.2016
11:49:53
Dmitry Volodin pushed to noc/feature/microservices
card: Show tooltips on alarm heatmap

Ivan
21.11.2016
11:50:35
я потерялся, а где у нас хитмап?

Andrey
21.11.2016
11:50:52
FM

Dmitry
21.11.2016
11:51:07
там теперь прикольные tooltip'ы

Ivan
21.11.2016
11:51:34
а я щас проверю
FM
спасибо, я какой-то кривой

Maksim
21.11.2016
12:25:29
вот его не поймешь. 219 устройств, 1.5 гига памяти занято. вроде фурычит.

Ruslan
21.11.2016
12:39:03
кто-нибудь подскажет куда копать
пытаюсь сохранить PyRule

Ilya
21.11.2016
12:41:24
У нас начались споры что оставить, zabbix/noc

Ruslan
21.11.2016
12:42:02
как вообще это можно продебажить?

Dmitry
21.11.2016
12:44:04
Заббикс с NOC сложно сравнивать
они совсем разные
и задачи совсем разные

Maksim
21.11.2016
12:45:35
У нас начались споры что оставить, zabbix/noc
вот скажу так, у нас забикс для мониторига распред сети и спама в телеграмку алармов. А Нок сцука умный. Вот конфиги сохраняет, осталось только понять как он логи чекает, что бы криворуких наказывать

Ilya
21.11.2016
12:46:15
никто неи трогает нок, кроме меня и моего одного коллеги

Maksim
21.11.2016
12:47:06
можно то можно, но тут то можно и посмотреть и проверить и сравнить.

Google

E_zombie
21.11.2016
12:52:40
@somovis я в такой же позиции. и никто не пытается свои рабочие процессы автоматизировать ноком. полнейший бред и сабботаж. я решил так. оставить во внешке тот функционал который не может повторить нок и повырубать его в ноке .

Dmitry
21.11.2016
12:54:22
и много ли того функционала?
:)

E_zombie
21.11.2016
12:55:21
это каждый решает сам.
сегдня наблюдал картину маслом. пришёл админ отвечающий за дсламы и рассказывает как в балаково получили кучу говна и ТТ изза того что ПО на дсламе старое стояло. и он по совместительству один из главных хейтеров\сабботажников.

Maksim
21.11.2016
12:59:41
в Балаково всегда все уово.
даж по билайну помню )

E_zombie
21.11.2016
13:00:15
там бабы хорошие

Ruslan
21.11.2016
13:20:42
Нужна помощь, как решить проблему?

Andrey
21.11.2016
13:22:43
configobj это что?

Ruslan
21.11.2016
13:23:29
Это альтернатива configparser

Andrey
21.11.2016
13:23:44
O_O

Andrey
21.11.2016
13:24:29
ok и где он лежит?

Ruslan
21.11.2016
13:31:14
В python обычном работает

Dmitry
21.11.2016
13:34:19
virtualenv там
./bin/pip install configobj

Ivan
21.11.2016
13:52:55
https://kb.nocproject.org/display/SITE/NOC
древности
@freeseacher у меня дискавери и прочее не хотят завершаться во время обновления корректно. Соотв. потом не встают
это даде после service noc stop/start

Google

Ivan
21.11.2016
14:41:39
в башне ставлю только install every
есть живые?
или где-то race cond, что супервизор не прибивает или ещё чего

Dmitry
21.11.2016
14:54:35
https://forum.getnoc.com/t/fm/42
нате на подумать
Леша в отпуске и греет пузо с мулатками в обнимку

Admin
ERROR: S client not available

Ivan
21.11.2016
14:55:26
ясно, а ты не в курсе, почему так происходит?

Dmitry
21.11.2016
14:56:25
может в syscall висят?

Ivan
21.11.2016
14:57:41
как посмотреть? в htop Они даже что-то делают по процам

E_zombie
21.11.2016
17:02:30
мнда. прочитал я идею. она конечно хороша в плане нагрузки на оборудование. но как поведёт себя система если обесточка всего района или вальнулось 1-2 ПЕ
валится ПЕ или несколько плат на ней а на карте аварий часть хостов будет зелёных.

Ilya
21.11.2016
17:18:19
Тогда вообще все перестанет работать?)

E_zombie
21.11.2016
17:59:09
может просто прорисовать "топологию" и критические точки что если они упали то за ними уже не сканить. например это будет ПЕ в датацентре.
какоето странное гавно.
пробую открыть эвенты на какуюто железку. система стаёт раком. ЛА скачет до небес. в этот момент монга на первой ноде отваливается по таймауту от кластера и второй хост подхватывает монгу. обратно конечно монга не возвращает на первый мастера.
может в events по умолчанию фильтр поставим на 1 день чтобы не грузить монгу?

kk
21.11.2016
18:14:07
помогло да.
а если порядок загрузки лимитов проверить. будет работать без правки .service ?
https://access.redhat.com/solutions/199993

E_zombie
21.11.2016
18:14:56
подозреваю что нет.

Google

kk
21.11.2016
18:15:05
а проверить - su pgbouncer; ulimit -n ?

E_zombie
21.11.2016
18:15:18
когда делаешь su - pgbouncer && ulimit -a там всё ОК.
то что настроено в limits.cong

kk
21.11.2016
18:16:53
не особо хочется "писать" ещё 1 файл.
мне не нагрузить баунсер чтобы проверить (
центосники. расскажите как у вас живёт баунсер =)
это
а вот точно бансер новой версии?

Алексей
21.11.2016
18:37:46

Zek
21.11.2016
18:38:09
а ты чего в отпуске не работаешь

Ivan
21.11.2016
19:01:40

Ilya
21.11.2016
19:55:53
Сломали и ушли :)

Ivan
21.11.2016
19:59:08
Ага
Ваще
@dvolodin в ноке есть пид файлы для каждого процесса?

Dmitry
22.11.2016
05:49:42
да, есть
./noc ctl status
:)