
Gabii
13.04.2016
12:48:09
I'll see if he can do the upgrade with what you've explained
and give you feedback
Thanks a lot!!

Илья
13.04.2016
12:49:40
only @dvolodin can use noc without help

Google

Dmitry
13.04.2016
12:49:53
не собирается телеграм из гита под FreeBSD

Gabii
13.04.2016
12:50:31
Hahaha that's comforting :)

E_zombie
13.04.2016
12:52:41
lold


Dmitry
13.04.2016
13:09:02
16:01:59) Dmitry: dvolodin: запустил NOC
(16:02:33) Dmitry: 2016-04-13 14:51:02,943 [activator] [RPC call from sae] activator.script([u'Juniper.JUNOS.get_version', {u'name': u'Juniper MX5-T', u'super_password': None, u'user': u'mitya', u'address': u'10.111.0.21', u'path': None, u'password': u'ghju6y', u'cli_protocol': u'ssh'}, {}, {u'platform': u'mx5-t', u'version': u'14.2R4.9', u'vendor': u'Juniper'}, {}, None])
(16:02:33) Dmitry: 2016-04-13 14:51:02,945 [activator] [RPC call from sae] activator.script([u'Cisco.IOS.get_uptime', {u'name': u'C3560-16', u'super_password': None, u'user': u'mitya', u'address': u'10.111.0.16', u'path': None, u'password': u'ghju6y', u'cli_protocol': u'ssh'}, {u'Network | LLDP': True, u'Network | CDP': True, u'Network | STP': True, u'DB | Interfaces': 30}, {u'platform': u'C3560', u'version': u'12.2(58)SE2', u'vendor': u'Cisco'}, {}, None])
(16:02:33) Dmitry: 2016-04-13 14:51:02,946 [activator] [RPC call from sae] activator.script([u'Cisco.IOS.get_uptime', {u'name': u'C3560-15', u'super_password': None, u'user': u'mitya', u'address': u'10.111.0.15', u'path': None, u'password': u'ghju6y', u'cli_protocol': u'ssh'}, {u'Network | LLDP': True, u'Network | CDP': True, u'Network | STP': True, u'DB | Interfaces': 54}, {u'platform': u'C3560', u'version': u'12.2(58)SE2', u'vendor': u'Cisco'}, {}, None])
(16:02:33) Dmitry: 2016-04-13 14:51:02,950 [noc.core.script.loader] Loading script Juniper.JUNOS.get_version
(16:02:59) Dmitry: dvolodin: что ты там говорил, что при старте оно не долбится ?
(16:04:09) Dmitry: заходим на Juniper
(16:04:30) Dmitry: CPU states: 31.8% user, 0.0% nice, 60.6% system, 5.5% interrupt, 2.1% idle
(16:04:30) Dmitry: Mem: 1168M Active, 79M Inact, 180M Wired, 374M Cache, 112M Buf, 182M Free
(16:04:30) Dmitry: Swap: 2837M Total, 2837M Free
(16:04:30) Dmitry: PID USERNAME THR PRI NICE SIZE RES STATE TIME WCPU COMMAND
(16:04:30) Dmitry: 99878 root 1 127 0 43116K 7344K RUN 0:06 26.95% ifinfo
(16:04:30) Dmitry: 99854 mitya 1 124 0 51796K 40872K RUN 0:05 19.70% cli
(16:04:30) Dmitry: 99855 root 1 4 0 52928K 4416K sbwait 0:03 11.94% mgd
(16:04:30) Dmitry: 99851 root 1 121 0 8432K 3436K select 0:03 11.42% sshd
(16:04:48) Dmitry: Да нахуй такое надо !!!


Илья
13.04.2016
13:09:52
что это было?

Dmitry
13.04.2016
13:10:40
1 заход на juniper, 2 на 3750

Илья
13.04.2016
13:11:07
кто-то пароль засветил

Dmitry
13.04.2016
13:12:07
и поможет тебе пароль на хост 10.111.0.15 ?

Алексей
13.04.2016
13:12:21
@dvolodin надо бы правда не выводить туда пароль или выводить звездами
а то так возможны казусы

Dmitry
13.04.2016
13:12:36
да пофиг

Алексей
13.04.2016
13:12:44
ну я соглашусь что пофиг

Dmitry
13.04.2016
13:12:57
тут Дима божился, что при старте NOC он не лезет на железки

Google

Ilya
13.04.2016
13:13:00
с иб потом трудно договориться будет, лучше *

Dmitry
13.04.2016
13:13:32
не успел запустить, как начал ломиться

Алексей
13.04.2016
13:13:37
в данном случае да пофиг. но будь хост белый Диме предстояло бы большая работы после одного действа в сердцах

Ilya
13.04.2016
13:14:12
))

Илья
13.04.2016
13:14:48
да, для вывода пароля просто ключик добавить с команде дебага

Dmitry
13.04.2016
13:15:10
так как у нас ветка для разработчиков, то перезапускаю NOC несколько раз за день
и каждый раз он как дурной начинает ломиться на железки

Илья
13.04.2016
13:15:37
а что он должен делать?

Dmitry
13.04.2016
13:15:45
ничего
у него таймаут стоит в год

Илья
13.04.2016
13:16:07
а как узнать что год прошел

Ilya
13.04.2016
13:16:16
Это таймаут после выполнения последнего
Реально, ты его только запустил - это нормальное действие

Dmitry
13.04.2016
13:16:43
нормальное действие:
last pid: 99879; load averages: 0.73, 1.09, 2.08 up 202+00:10:10 16:05:59
92 processes: 3 running, 89 sleeping
CPU states: 31.8% user, 0.0% nice, 60.6% system, 5.5% interrupt, 2.1% idle
Mem: 1168M Active, 79M Inact, 180M Wired, 374M Cache, 112M Buf, 182M Free
Swap: 2837M Total, 2837M Free
PID USERNAME THR PRI NICE SIZE RES STATE TIME WCPU COMMAND
99878 root 1 127 0 43116K 7344K RUN 0:06 26.95% ifinfo
99854 mitya 1 124 0 51796K 40872K RUN 0:05 19.70% cli
99855 root 1 4 0 52928K 4416K sbwait 0:03 11.94% mgd
99851 root 1 121 0 8432K 3436K select 0:03 11.42% sshd
это Juniper MX, где в онлайне около шести тысяч абонентов
это нормально ?

Dmitry
13.04.2016
13:18:28
что его тривиальная команда так выносит?

Dmitry
13.04.2016
13:19:35
нет
там куча глюков при discovery, и оно начинает долбиться, пока не успела отработать предыдущая команда

Google

E_zombie
13.04.2016
13:23:04
уважаемые доны. а не ахуеть ли вам

Dmitry
13.04.2016
13:23:12
2016-04-13 14:51:04,634 [script] [Juniper.JUNOS.get_interfaces|10.111.0.21] Running. Input arguments: {}, timeout 120

E_zombie
13.04.2016
13:23:18
2016-04-13 16:22:13,431 [noc.core.ioloop.ping] [ччччххххх] Ping (req=46897, seq=0, timeout=1000ms)
я упоролся или таймаут в 1 секунду

Dmitry
13.04.2016
13:27:42
я не знаю

Dmitry
13.04.2016
13:28:16
да, секунда, а что?

E_zombie
13.04.2016
13:29:12
а теперь понятно почему у меня всё раком вставало. как тольско виртуалка хотябы на минуту загружается по ИО там все 10 000 падает в аварии.
и идёт по кругу всё.

Dmitry
13.04.2016
13:29:47
# ./noc start
Starting noc.
Error: The directory named as part of the path var/log/activator-default-00.log does not exist.

E_zombie
13.04.2016
13:29:49
и как я понимаю это нигде не настраивается.

Dmitry
13.04.2016
13:30:08
я такое впервые вижу

Ilya
13.04.2016
13:30:14

Dmitry
13.04.2016
13:30:22
он что, не может log файл создать ?

E_zombie
13.04.2016
13:30:43
гы. может и такое быть. там с правами весёлости могут быть

Dmitry
13.04.2016
13:31:36
# ls -al
total 48
drwxr-xr-x 12 root wheel 512 Apr 13 14:50 .
drwxrwxrwt 43 root wheel 1536 Apr 13 15:31 ..
drwxr-xr-x 3 noc wheel 512 Apr 13 14:18 cp
drwxr-xr-x 3 root wheel 512 Apr 13 14:47 db
drwxr-xr-x 7 root wheel 512 Apr 13 14:50 etc
drwx------ 3 noc wheel 512 Apr 13 14:50 jupyter
drwxr-xr-x 2 noc wheel 512 Apr 13 16:21 log
какие ему права нужны на "log" ?
не, права не катят
чего-то еще ему надо
блин, кто делал конфиг nginx ?
зачем было туда гвоздями прибивать "/opt/noc" ?

Google

E_zombie
13.04.2016
13:44:18
этот путь в башне настраивается

Ilya
13.04.2016
13:46:35
@dvolodin Дим, можно добавить поле в alarm trigers - interface classification rules, что бы только на определенных портах дропать события
Например куда подключены wifi точки очень много событий mac flap, что естественно

Dmitry
13.04.2016
13:47:35
https://bitbucket.org/nocproject/noc/commits/ed3770bdcd3b04ee8656684cc77d091af80f5b60

Ilya
13.04.2016
13:50:56

Dmitry
13.04.2016
13:54:08
<a href="http://i.imgur.com/utyF59b.png">
<img src="http://imgur.com/utyF59bl.png" />
</a>
@dvolodin

Илья
13.04.2016
13:54:44
здесь картинки можно напрямую пастить

Dmitry
13.04.2016
13:55:02
А теперь объясни мне, почему NOC поломился на Juniper сразу после старта

Ilya
13.04.2016
13:55:51

Dmitry
13.04.2016
13:56:50
Дима рассказывал, что наоборот, присутствие этой галочки заставляет выполнятся скрипты

Ilya
13.04.2016
13:56:58
Да и уже писали, он же не знает после старта когда в последний раз было опрос и был успешный или нет

Dmitry
13.04.2016
13:57:23
Так не стоит галочка, "опрашивать после старта"
А даже если и стоит, то там указана 1000 секунд
А он через пару секунд после старта ломится на железку

Ilya
13.04.2016
13:58:12

Dmitry
13.04.2016
13:58:34
@dvloodin прокомментируй

Ilya
13.04.2016
13:58:53
не у всех же много иопсов :)

Dmitry
13.04.2016
13:59:17
да, таймаут в 16 минут

Google

Dmitry
13.04.2016
13:59:34
кстати, к вопросу о juniper'е
он у тебя config changed не шлет на каждого абонента?

Dmitry
13.04.2016
13:59:49
пофиг, что с галочкой, что без галочки, он ломится сразу после старта системы
и чуть ли не каждую секунду

Dmitry
13.04.2016
14:00:14
вот нет у него такой привычки, что-то ты навертел

Dmitry
13.04.2016
14:00:16
джунипер у меня вообще ничего не шлет

Dmitry
13.04.2016
14:00:19
смотри коллекцию
noc.scheduler.default
что там за расписания

Dmitry
13.04.2016
14:00:50
я поотключал syslog и trap на всех железках из-за того, что NOC начинает на них ломиться
как посмотреть коллекцию ?

Dmitry
13.04.2016
14:02:12
db.noc.schedules.default.find()

Gabii
13.04.2016
14:04:07
@ivzakharov and @dvolodin: I managed to upgrade using only './scripts/upgrade' because I was already logged in as root.. The upgrade is running on TEST NOC now, I guess it'll go ok :D

Dmitry
13.04.2016
14:04:34
noc:PRIMARY> db.noc.schedules.default.find();
Error: error: {
"ok" : 0,
"errmsg" : "not authorized on noc to execute command { find: \"noc.schedules.default\", filter: {} }",
"code" : 13
}

E_zombie
13.04.2016
14:04:38
это как лечить ? 4161/lookup?topic=correlator.dispose query error: HTTP 599: Failed connect

Dmitry
13.04.2016
14:04:38
testing is not necessaty

Dmitry
13.04.2016
14:06:10
таймауты увидели ?
а теперь смотрим логи:
2016-04-13 16:45:47,539 [script] [Cisco.IOS.get_fqdn|10.111.0.8] Running. Input arguments: {}, timeout 120
2016-04-13 16:45:47,543 [script] [Cisco.IOS.get_fqdn|10.111.0.8] Complete (4.10ms)
2016-04-13 16:45:57,202 [script] [Cisco.IOS.get_fqdn|10.111.0.8] Running. Input arguments: {}, timeout 120
2016-04-13 16:45:57,205 [script] [Cisco.IOS.get_fqdn|10.111.0.8] Complete (3.00ms)