@nocproject

Страница 166 из 2357
Alex
08.07.2016
13:54:01
Полузакрытые советы будут видны в netstat

Dmitry
08.07.2016
13:54:20
root@noc:/usr/local/noc/etc # netstat -m 301/1754/2055 mbufs in use (current/cache/total) 277/1305/1582/25600 mbuf clusters in use (current/cache/total/max) 277/747 mbuf+clusters out of packet secondary zone in use (current/cache) 0/913/913/12800 4k (page size) jumbo clusters in use (current/cache/total/max) 0/0/0/6400 9k jumbo clusters in use (current/cache/total/max) 0/0/0/3200 16k jumbo clusters in use (current/cache/total/max) 629K/6700K/7329K bytes allocated to network (current/cache/total) 0/0/0 requests for mbufs denied (mbufs/clusters/mbuf+clusters) 0/0/0 requests for jumbo clusters denied (4k/9k/16k) 0/0/0 sfbufs in use (current/peak/max) 0 requests for sfbufs denied 0 requests for sfbufs delayed 3858 requests for I/O initiated by sendfile 0 calls to protocol drain routines

Alex
08.07.2016
13:54:25
Как ESTABLISHED

[root@noc etc]# netstat -m netstat: invalid option -- 'm'

Google
Dmitry
08.07.2016
13:55:34
обычно они видны как TIME_WAIT

или FIN_WAIT

для микротика в профиль добавь command_exit="quit"

тогда он корректно будет закрывать сессию

и в остальные железки тоже подобавляй команды для корректного завершения сессии

Alex
08.07.2016
14:00:33
TIME_WAIT тоже нет

Я бы увидел сотни строк в netstat

Ничего необычного.

Dmitry
08.07.2016
14:02:01
у меня нету идей. у меня самого develop ветка крутится на отдельной машинке без проблем. правда там FreeBSD стоит

Alex
08.07.2016
14:02:55
CentoOS 7 Selinux On

Пробовал выключить не помогло

Да и работает же он как то 20-30 минут

/dev/mapper/DB-NOCDB 50G 9.5G 38G 21% /opt/DB

Google
Alex
08.07.2016
14:03:57
KiB Mem : 3882828 total, 858112 free, 904992 used, 2119724 buff/cache

Вот опять застыл

Алексей
08.07.2016
14:09:01
@Zhdanovich таки попробуй с manhole

в ключи в коинфге через морду.

main / setup /config

там скажи noc-activator

убедись что manhole включен.

перезапусти актоватор.

дождись ситуации с проблемой

зайди в manhole через socat

Alex
08.07.2016
14:10:27
2016-07-08 09:03:31,781 [noc.sa.activator.activator] [Generic.get_uptime(WAP-P58-UBQ-1.WTG-WRL-TXR, 10.60.20.2)] Running. Timeout 120 [7/500 threads] 2016-07-08 09:03:32,634 [noc.sa.activator.activator] Cancelling stale script Generic.get_interface_status_ex(172.16.130.14) 2016-07-08 09:03:32,634 [script] Cancelled 2016-07-08 09:03:32,635 [noc.sa.activator.activator] [Generic.get_interface_status_ex(RTR-END-CSO-1.QKL-QGM-OFF, 172.16.119.51)] Stopping. Cancelled [6/500 threads] (12)

Алексей
08.07.2016
14:10:33
вывод того получилось положи на пасту.

и дай линк сюда

Alex
08.07.2016
14:10:37
И тишина

Dmitry
08.07.2016
14:19:22
это лог активатора ?

по ходу таких сообщений не могу найти в активаторе какая-то древняя инсталляция

Алексей
08.07.2016
14:23:59
эх.

да пофиг

Евгений
08.07.2016
14:25:45
А вот какая-то фигня происходит. У меня переодик на Джунипер подвис в состоянии Run. Рядом в окне лог - выполнился полностью. А состояние Run и новые переодики не запускаются, разумеется. Перегрузил НОК - пофигу, состояние Run. Чего-бы еще перегрузить?

Google
Алексей
08.07.2016
14:26:37
дискавери при рестарте сбрасывает состояние запущенности тасков

Евгений
08.07.2016
14:27:01
А как его одного перегрузить?

Алексей
08.07.2016
14:27:11
если не помогло, а такое было пару тройку раз то активаторы

./noc ctl

restart discovery

Евгений
08.07.2016
14:27:33
Спасибо

Алексей
08.07.2016
14:27:50
не уверен в последней команде но что то типа

Евгений
08.07.2016
14:28:45
noc@URANNOC/DC1/urannocnode1> restart discovery-default:discovery-default-00 discovery-default:discovery-default-00: stopped discovery-default:discovery-default-00: started

Ну вот как-то так.

Алексей
08.07.2016
14:28:59
ага да

Евгений
08.07.2016
14:30:46
Не помогло. Рестарт дисковери и активаторов . Состояние - Run

Последний вопрос, из командной строки можно как-то запустить периодик на конкретную железку чтобы посмотреть где затыкается и как?

Евгений
08.07.2016
14:43:06
Помогло только снять налочку Мэнеджет и потом поставить обратно. Но периодик опять ушел в Ран и не возвращается.

Alex
08.07.2016
16:31:54
Сорри. Упало другое пришлось бросить нок.

Dmitry Luhtionov: это просто ветка не микросервисная

Как сказали выше в в микросервисной не работают сниппеты

Засада

Старый виснет новый не работает. :)

0.8 стоял работал не вис. Обновил до 15.1 :).

Zek
08.07.2016
17:09:01
сниппеты чинить-то собирается кто-нибудь? ;)

Google
Ilya
08.07.2016
17:53:57
Переходи на новый в надежде на фиксы)

Алексей
08.07.2016
19:29:08
@somovis рекомендую под /opt/noc/var/db/nsq сделать отдельный диск. или разел.

Алексей
08.07.2016
19:29:19
что бы можно было контролировать его конечность

при аварии на influx например nsqd будет туда скалдировать метрики.

Alex
08.07.2016
19:30:08
Руки и ноги.

Алексей
08.07.2016
19:30:18
как показала практика influxdb может подниматься очень долго.

и желательно что бы nsqd не убил сервер переполенением диска

Admin
ERROR: S client not available

Zek
08.07.2016
19:30:52
Переходи на новый в надежде на фиксы)
не, ну а как без них конфиги править-то

Zek
08.07.2016
19:31:18
и нахрена тогда нок нужен? )

Алексей
08.07.2016
19:31:51
и нахрена тогда нок нужен? )
я думаю Илья имеет ввиду ./noc shell

Ilya
08.07.2016
19:32:13
Алексей
08.07.2016
19:33:06
у тя тут вот /opt/noc/var/etc/nsq

есть файлик

nsqd.conf

там написано такое вот data_path = "/opt/noc/var/db/nsq"

Google
Ilya
08.07.2016
19:33:53
вижу

Понял

В tower может опцию добавить?

Алексей
08.07.2016
19:35:18
от колва метрик зависит

надо изучать эксперементально

8 гигов хватает на полтора миллиона примерно

Ilya
08.07.2016
19:36:21
У меня не много, всего 300 железок и со всех интерфейсы дергает (почти все железки - стаки из 4х 48 портовых +/- )

Алексей
08.07.2016
19:36:24
В tower может опцию добавить?
нет смысла. реально настройка под аварии

Zek
08.07.2016
19:37:05
а как шелл питона поможет записать пицот конфигов?

Алексей
08.07.2016
19:37:07
У меня не много, всего 300 железок и со всех интерфейсы дергает (почти все железки - стаки из 4х 48 портовых +/- )
не морочься тогда. если ты мониторишь состояние influx то чисто технически на паре тройке гигов должен долго продержаться.

Алексей
08.07.2016
19:38:15
ну и во время такой аварии nsq будет сначала писать в память.

как раз этот параметр задается в морде

а потом уже складывать на диск.

если потерять чего боишься - меньше в память больше в диск. ну или наоборот.

Ilya
08.07.2016
19:39:12
Завтра потыкаю, уже спать хочу. Доброй ночи!

Zek
08.07.2016
19:40:34
@freeseacher, никого не хочу обидеть, но noc без инструмента управления конфигурациями - это не нок )

Страница 166 из 2357