
Ivan
30.08.2017
13:34:55
я думаю, костыль надо сделать в скрипте

Алексей
30.08.2017
13:35:28
Какой?

Ivan
30.08.2017
13:36:06
If string == "Device is busy" then beer

Dmitry
30.08.2017
13:36:12
нет

Google

Ilya
30.08.2017
13:36:24
лол

Dmitry
30.08.2017
13:37:03
у нас там намечается типа расширение функционала pattern_operation_error

Bitbucket
30.08.2017
13:46:51
Maksim pushed to noc/feature/microservices
Fix NAG.SNR _init_ and add get_interfaces

Dubridze
30.08.2017
13:53:25
парни, что за херня последнее время?
делаю деплой, все работает
через несколько дней ошибка 502 Bad Gateway
nginx/1.12.1
делаю деплой опять работает
несколько дней
я понимаю что при деплое сервис рестартится и все начниает работаеть
но какого хера оно потом падает

Ivan
30.08.2017
13:54:48
скорее всего, монго

Dubridze
30.08.2017
13:57:07
TASK [node : add clickhouse data to legacy config] 01:23
fatal: [mgts-noc01]: FAILED! => {
"failed": true
}
MSG:
the field 'args' has an invalid value, which appears to include a variable that is undefined. The error was: {{noc_config['config'].get('clickhouse-global-%s' % groups['svc-clickhouse'][0]).get('db', 'noc')}}: list object has no element 0
The error appears to have been in '/opt/tower/var/tower/playbooks/MGTS/ansible/roles/node/tasks/config.yml': line 1, column 3, but may
be elsewhere in the file depending on the exact syntax problem.
The offending line appears to be:
- name: add clickhouse data to legacy config
^ here
to retry, use: —limit @/opt/tower/var/tower/playbooks/MGTS/ansible/site.retry

Google

Алексей
30.08.2017
14:05:24

Dubridze
30.08.2017
14:05:46
выбрал
сейчас пробую еще раз

Алексей
30.08.2017
14:05:53
такое бывает
однозначно воспроизвести для фикса пока не можем


Dubridze
30.08.2017
14:08:37
TASK [mongod : Initial replica set configuration]02:33
fatal: [mgts-noc01]: FAILED! => {
"changed": true,
"cmd": "/usr/bin/mongo /etc/mongod/rsinit.js",
"delta": "0:00:00.066723",
"end": "2017-08-30 17:08:28.208338",
"failed": true,
"rc": 1,
"start": "2017-08-30 17:08:28.141615"
}
STDOUT:
MongoDB shell version: 3.2.13
connecting to: test
2017-08-30T17:08:28.202+0300 W NETWORK [thread1] Failed to connect to 127.0.0.1:27017, in(checking socket for error after poll), reason: errno:111 Connection refused
2017-08-30T17:08:28.203+0300 E QUERY [thread1] Error: couldn't connect to server 127.0.0.1:27017, connection attempt failed :
connect@src/mongo/shell/mongo.js:229:14
@(connect):1:6
STDERR:
exception: connect failed
to retry, use: —limit @/opt/tower/var/tower/playbooks/MGTS/ansible/site.retry
что сейчас нужно сделать?

Алексей
30.08.2017
14:09:02
что с монгой ?

Dubridze
30.08.2017
14:27:03
а хз

Алексей
30.08.2017
14:27:28
сделай что бы ей было хорошо

Dubridze
30.08.2017
14:28:05
ps -ax | grep mong
3067 pts/0 S+ 0:00 grep mong
27672 ? Ssl 0:15 /usr/bin/mongod —quiet —config /etc/mongod.conf
ей вроде неплохо
со второго раза деплой прошел
тоже в последнее время часто происходит

Ivan
31.08.2017
05:37:59
Какая ОС на твоём корыте?

E_zombie
31.08.2017
06:11:17
Виндовс нт палюбас

bee26
31.08.2017
06:25:51
[syslogcollector] Failed to start syslog server at 0.0.0.0:514: [Errno 13] Permission denied - что-то опять перемудрили
[trapcollector] Failed to start SNMP Trap server at 0.0.0.0:162: [Errno 13] Permission denied

Ilya
31.08.2017
06:42:19
Прям расхотелось обновляться

Google

Andrey
31.08.2017
06:42:59
и правильно
пятница завтра

Ivan
31.08.2017
06:44:49

Ilya
31.08.2017
06:46:12
?

Ivan
31.08.2017
06:46:48
нихера у меня ни разу не пришло аварии, что конфиг неправильный
у кого-то работает?

bee26
31.08.2017
06:47:20
раньше работало, а щас не знаю

Ilya
31.08.2017
06:53:06
?

Ivan
31.08.2017
06:54:26
Уведомления о несоответствии конфига

fx00f
31.08.2017
07:21:02

Ilya
31.08.2017
07:21:18
А, ну это нормально
?

fx00f
31.08.2017
07:21:43
У меня вот нет времени обновлять НОК, так он и не падает)))

Ilya
31.08.2017
07:22:25
Такая же фигня

Dmitry
31.08.2017
07:27:45
вот вот, не теребите его

Ivan
31.08.2017
07:28:54

Ilya
31.08.2017
07:45:29
Ты мануал сделал?

Ivan
31.08.2017
07:45:46
как я сделаю мануал, если не работает?
мануал по валидации есть уже: https://kb.nocproject.org/pages/viewpage.action?pageId=22970543

Google

Dmitry
31.08.2017
07:47:05
по валидации - хочу переделать проверки с clips на python
один хрен - они простые

Ivan
31.08.2017
07:48:16
Дима, почему может не быть уведомлений?

Dmitry
31.08.2017
07:49:52
уведомлений о чем?

Andrey
31.08.2017
07:50:26
я вчера же писал
по конфигам алармы не проходят коррелятор
поэтому, эскалации не создаются

Ivan
31.08.2017
07:50:51

Andrey
31.08.2017
07:51:02
без разницы

Ivan
31.08.2017
07:51:07
ох

Dmitry
31.08.2017
07:51:11
зонтики-то?
да, мы их не эскалируем

Ivan
31.08.2017
07:51:29

Andrey
31.08.2017
07:51:57
там одинаковый механизм
Аварии создаются напрямую
без коррелятора

Ivan
31.08.2017
07:52:28
Хорошо, тогда как получить уведомления, что такой-то хост имеет ненадлежащий конфиг?

Dmitry
31.08.2017
07:56:27
там логика немного другая
нет смысла выжидать какое-то время

Google

Andrey
31.08.2017
07:57:53
вообще, у меня давнее желание сделать отчёт по валидации
не всегда имеет смысл генерить аларм
лучше отчёт раз в сутки
там будут изменения конфигов и аварии валидации
чтобы можно было оценить масштаб бедствий

Ivan
31.08.2017
07:59:06

Andrey
31.08.2017
07:59:19
толку)
это нереализуемо сейчас

Ivan
31.08.2017
08:03:59
заебись!

Dmitry
31.08.2017
08:30:09
тоже дело
что у нас с netflow?

Ivan
31.08.2017
08:30:35
у меня жопа пока со временем свободным, я помнб
из-за нерабочей макдб пришлось писать свой поиск

Алексей
31.08.2017
08:34:39
"писать" Ваня ?
ты что программист ?

Ivan
31.08.2017
08:34:59
ты тоже
приходится, когда @dvolodin поломал MacDb и чинить не хочет

Dmitry
31.08.2017
08:42:05
не поломал, а переделал
я же сказал - macdb будет, когда будет moversion

Ivan
31.08.2017
08:43:02
Ты не предупреждал, что всё поломается.
Это — некрасиво, как минимум