@nocproject

Страница 5 из 2357
Gabii
13.04.2016
12:48:09
I'll see if he can do the upgrade with what you've explained

and give you feedback

Thanks a lot!!

Илья
13.04.2016
12:49:40
only @dvolodin can use noc without help

Google
Dmitry
13.04.2016
12:49:53
не собирается телеграм из гита под FreeBSD

Gabii
13.04.2016
12:50:31
Hahaha that's comforting :)

E_zombie
13.04.2016
12:52:41
lold

Dmitry
13.04.2016
13:09:02
16:01:59) Dmitry: dvolodin: запустил NOC (16:02:33) Dmitry: 2016-04-13 14:51:02,943 [activator] [RPC call from sae] activator.script([u'Juniper.JUNOS.get_version', {u'name': u'Juniper MX5-T', u'super_password': None, u'user': u'mitya', u'address': u'10.111.0.21', u'path': None, u'password': u'ghju6y', u'cli_protocol': u'ssh'}, {}, {u'platform': u'mx5-t', u'version': u'14.2R4.9', u'vendor': u'Juniper'}, {}, None]) (16:02:33) Dmitry: 2016-04-13 14:51:02,945 [activator] [RPC call from sae] activator.script([u'Cisco.IOS.get_uptime', {u'name': u'C3560-16', u'super_password': None, u'user': u'mitya', u'address': u'10.111.0.16', u'path': None, u'password': u'ghju6y', u'cli_protocol': u'ssh'}, {u'Network | LLDP': True, u'Network | CDP': True, u'Network | STP': True, u'DB | Interfaces': 30}, {u'platform': u'C3560', u'version': u'12.2(58)SE2', u'vendor': u'Cisco'}, {}, None]) (16:02:33) Dmitry: 2016-04-13 14:51:02,946 [activator] [RPC call from sae] activator.script([u'Cisco.IOS.get_uptime', {u'name': u'C3560-15', u'super_password': None, u'user': u'mitya', u'address': u'10.111.0.15', u'path': None, u'password': u'ghju6y', u'cli_protocol': u'ssh'}, {u'Network | LLDP': True, u'Network | CDP': True, u'Network | STP': True, u'DB | Interfaces': 54}, {u'platform': u'C3560', u'version': u'12.2(58)SE2', u'vendor': u'Cisco'}, {}, None]) (16:02:33) Dmitry: 2016-04-13 14:51:02,950 [noc.core.script.loader] Loading script Juniper.JUNOS.get_version (16:02:59) Dmitry: dvolodin: что ты там говорил, что при старте оно не долбится ? (16:04:09) Dmitry: заходим на Juniper (16:04:30) Dmitry: CPU states: 31.8% user,  0.0% nice, 60.6% system,  5.5% interrupt,  2.1% idle (16:04:30) Dmitry: Mem: 1168M Active, 79M Inact, 180M Wired, 374M Cache, 112M Buf, 182M Free (16:04:30) Dmitry: Swap: 2837M Total, 2837M Free (16:04:30) Dmitry:   PID USERNAME  THR PRI NICE   SIZE    RES STATE    TIME   WCPU COMMAND (16:04:30) Dmitry: 99878 root        1 127    0 43116K  7344K RUN      0:06 26.95% ifinfo (16:04:30) Dmitry: 99854 mitya       1 124    0 51796K 40872K RUN      0:05 19.70% cli (16:04:30) Dmitry: 99855 root        1   4    0 52928K  4416K sbwait   0:03 11.94% mgd (16:04:30) Dmitry: 99851 root        1 121    0  8432K  3436K select   0:03 11.42% sshd (16:04:48) Dmitry: Да нахуй такое надо !!!

Илья
13.04.2016
13:09:52
что это было?

Dmitry
13.04.2016
13:10:40
1 заход на juniper, 2 на 3750

Илья
13.04.2016
13:11:07
кто-то пароль засветил

Dmitry
13.04.2016
13:12:07
и поможет тебе пароль на хост 10.111.0.15 ?

Алексей
13.04.2016
13:12:21
@dvolodin надо бы правда не выводить туда пароль или выводить звездами

а то так возможны казусы

Dmitry
13.04.2016
13:12:36
да пофиг

Алексей
13.04.2016
13:12:44
ну я соглашусь что пофиг

Dmitry
13.04.2016
13:12:57
тут Дима божился, что при старте NOC он не лезет на железки

Google
Ilya
13.04.2016
13:13:00
с иб потом трудно договориться будет, лучше *

Dmitry
13.04.2016
13:13:32
не успел запустить, как начал ломиться

Алексей
13.04.2016
13:13:37
в данном случае да пофиг. но будь хост белый Диме предстояло бы большая работы после одного действа в сердцах

Ilya
13.04.2016
13:14:12
))

Илья
13.04.2016
13:14:48
да, для вывода пароля просто ключик добавить с команде дебага

Dmitry
13.04.2016
13:15:10
так как у нас ветка для разработчиков, то перезапускаю NOC несколько раз за день

и каждый раз он как дурной начинает ломиться на железки

Илья
13.04.2016
13:15:37
а что он должен делать?

Dmitry
13.04.2016
13:15:45
ничего

у него таймаут стоит в год

Илья
13.04.2016
13:16:07
а как узнать что год прошел

Ilya
13.04.2016
13:16:16
Это таймаут после выполнения последнего

Реально, ты его только запустил - это нормальное действие

Dmitry
13.04.2016
13:16:43
нормальное действие:

last pid: 99879;  load averages:  0.73,  1.09,  2.08   up 202+00:10:10 16:05:59 92 processes:  3 running, 89 sleeping CPU states: 31.8% user,  0.0% nice, 60.6% system,  5.5% interrupt,  2.1% idle Mem: 1168M Active, 79M Inact, 180M Wired, 374M Cache, 112M Buf, 182M Free Swap: 2837M Total, 2837M Free   PID USERNAME  THR PRI NICE   SIZE    RES STATE    TIME   WCPU COMMAND 99878 root        1 127    0 43116K  7344K RUN      0:06 26.95% ifinfo 99854 mitya       1 124    0 51796K 40872K RUN      0:05 19.70% cli 99855 root        1   4    0 52928K  4416K sbwait   0:03 11.94% mgd 99851 root        1 121    0  8432K  3436K select   0:03 11.42% sshd

это Juniper MX, где в онлайне около шести тысяч абонентов

это нормально ?

Dmitry
13.04.2016
13:18:28
что его тривиальная команда так выносит?

Dmitry
13.04.2016
13:19:35
нет

там куча глюков при discovery, и оно начинает долбиться, пока не успела отработать предыдущая команда

Google
E_zombie
13.04.2016
13:23:04
уважаемые доны. а не ахуеть ли вам

Dmitry
13.04.2016
13:23:12
2016-04-13 14:51:04,634 [script] [Juniper.JUNOS.get_interfaces|10.111.0.21] Running. Input arguments: {}, timeout 120

E_zombie
13.04.2016
13:23:18
2016-04-13 16:22:13,431 [noc.core.ioloop.ping] [ччччххххх] Ping (req=46897, seq=0, timeout=1000ms)

я упоролся или таймаут в 1 секунду

Dmitry
13.04.2016
13:27:42
я не знаю

Dmitry
13.04.2016
13:28:16
да, секунда, а что?

E_zombie
13.04.2016
13:29:12
а теперь понятно почему у меня всё раком вставало. как тольско виртуалка хотябы на минуту загружается по ИО там все 10 000 падает в аварии.

и идёт по кругу всё.

Dmitry
13.04.2016
13:29:47
# ./noc start Starting noc. Error: The directory named as part of the path var/log/activator-default-00.log does not exist.

E_zombie
13.04.2016
13:29:49
и как я понимаю это нигде не настраивается.

Dmitry
13.04.2016
13:30:08
я такое впервые вижу

Dmitry
13.04.2016
13:30:22
он что, не может log файл создать ?

E_zombie
13.04.2016
13:30:43
гы. может и такое быть. там с правами весёлости могут быть

Dmitry
13.04.2016
13:31:36
# ls -al total 48 drwxr-xr-x  12 root  wheel   512 Apr 13 14:50 . drwxrwxrwt  43 root  wheel  1536 Apr 13 15:31 .. drwxr-xr-x   3 noc   wheel   512 Apr 13 14:18 cp drwxr-xr-x   3 root  wheel   512 Apr 13 14:47 db drwxr-xr-x   7 root  wheel   512 Apr 13 14:50 etc drwx------   3 noc   wheel   512 Apr 13 14:50 jupyter drwxr-xr-x   2 noc   wheel   512 Apr 13 16:21 log

какие ему права нужны на "log" ?

не, права не катят

чего-то еще ему надо

блин, кто делал конфиг nginx ?

зачем было туда гвоздями прибивать "/opt/noc" ?

Google
E_zombie
13.04.2016
13:44:18
этот путь в башне настраивается

Ilya
13.04.2016
13:46:35
@dvolodin Дим, можно добавить поле в alarm trigers - interface classification rules, что бы только на определенных портах дропать события

Например куда подключены wifi точки очень много событий mac flap, что естественно

Dmitry
13.04.2016
13:47:35
https://bitbucket.org/nocproject/noc/commits/ed3770bdcd3b04ee8656684cc77d091af80f5b60

Dmitry
13.04.2016
13:54:08
<a href="http://i.imgur.com/utyF59b.png">   <img src="http://imgur.com/utyF59bl.png" /> </a>

@dvolodin

Илья
13.04.2016
13:54:44
здесь картинки можно напрямую пастить

Dmitry
13.04.2016
13:55:02
А теперь объясни мне, почему NOC поломился на Juniper сразу после старта

Dmitry
13.04.2016
13:56:50
Дима рассказывал, что наоборот, присутствие этой галочки заставляет выполнятся скрипты

Ilya
13.04.2016
13:56:58
Да и уже писали, он же не знает после старта когда в последний раз было опрос и был успешный или нет

Dmitry
13.04.2016
13:57:23
Так не стоит галочка, "опрашивать после старта"

А даже если и стоит, то там указана 1000 секунд

А он через пару секунд после старта ломится на железку

Dmitry
13.04.2016
13:58:34
@dvloodin прокомментируй

Ilya
13.04.2016
13:58:53
Дима рассказывал, что наоборот, присутствие этой галочки заставляет выполнятся скрипты
Про это не в курсе, но выглядит наоборот, по логике это должен быть таймаут после старта системы

не у всех же много иопсов :)

Dmitry
13.04.2016
13:59:17
да, таймаут в 16 минут

Google
Dmitry
13.04.2016
13:59:34
кстати, к вопросу о juniper'е

он у тебя config changed не шлет на каждого абонента?

Dmitry
13.04.2016
13:59:49
пофиг, что с галочкой, что без галочки, он ломится сразу после старта системы

и чуть ли не каждую секунду

Dmitry
13.04.2016
14:00:14
вот нет у него такой привычки, что-то ты навертел

Dmitry
13.04.2016
14:00:16
джунипер у меня вообще ничего не шлет

Dmitry
13.04.2016
14:00:19
смотри коллекцию

noc.scheduler.default

что там за расписания

Dmitry
13.04.2016
14:00:50
я поотключал syslog и trap на всех железках из-за того, что NOC начинает на них ломиться

как посмотреть коллекцию ?

Dmitry
13.04.2016
14:02:12
db.noc.schedules.default.find()

Gabii
13.04.2016
14:04:07
@ivzakharov and @dvolodin: I managed to upgrade using only './scripts/upgrade' because I was already logged in as root.. The upgrade is running on TEST NOC now, I guess it'll go ok :D

Dmitry
13.04.2016
14:04:34
noc:PRIMARY> db.noc.schedules.default.find(); Error: error: {     "ok" : 0,     "errmsg" : "not authorized on noc to execute command { find: \"noc.schedules.default\", filter: {} }",     "code" : 13 }

E_zombie
13.04.2016
14:04:38
это как лечить ? 4161/lookup?topic=correlator.dispose query error: HTTP 599: Failed connect

Dmitry
13.04.2016
14:04:38
testing is not necessaty

Dmitry
13.04.2016
14:06:10
таймауты увидели ?

а теперь смотрим логи:

2016-04-13 16:45:47,539 [script] [Cisco.IOS.get_fqdn|10.111.0.8] Running. Input arguments: {}, timeout 120 2016-04-13 16:45:47,543 [script] [Cisco.IOS.get_fqdn|10.111.0.8] Complete (4.10ms) 2016-04-13 16:45:57,202 [script] [Cisco.IOS.get_fqdn|10.111.0.8] Running. Input arguments: {}, timeout 120 2016-04-13 16:45:57,205 [script] [Cisco.IOS.get_fqdn|10.111.0.8] Complete (3.00ms)

Страница 5 из 2357