
Алексей
28.08.2018
18:31:47
что бы докопатся до истины нужно проверить лог login сервиса найти там информацию о его id. потом погрепать логи консула на предемет сообщения deregister в journalctl
в прочем в логе логин процесса будет уже намек на факт чего ему было плохо. проверка лога консула только для пдтверждения гипотезы

Александр
28.08.2018
18:33:06
у меня веб падает пару раз в день после 15 числа, пойду искать логи

Алексей
28.08.2018
18:33:24
ад привязано ?

Google

Ivan
28.08.2018
18:33:52

Алексей
28.08.2018
18:34:04

Александр
28.08.2018
18:34:10

Алексей
28.08.2018
18:34:56
ldap да
про него речь
если проблема 2 раза в день значит в момент когда будет следующий раз проверить стоит в таком порядке
* cat /etc/nginx/upstream.conf там убедится что в апстриме login 127.0.0.1
* node_ip:8500 вкладка сервисов. там процессы login нужны их состояния
собранную информацию в сюда и в issue.

Александр
28.08.2018
18:47:28

Алексей
28.08.2018
18:48:03
да. получили дерегу.
ну значит виноват точно логин и в это время на nginx не было апстримов на которые можно отправить трафик логинов

Александр
28.08.2018
18:50:57
Алексей, подскажите, что дальше?

Алексей
28.08.2018
18:53:45
почитать логи login на предмет ошибок. создать задачку про это
ошибка будет в пределах 5 минут от дереги

Gitlab
28.08.2018
19:05:56

Google

Gitlab
28.08.2018
19:09:43
sysfaray opened merge request at / noc:
Add convert interface name for Eltex LTP

Alexander
29.08.2018
03:34:28
логи погрепал сразу после падения, пусто по id login
./noc crashinfo list во время падения нет ничего
2018-08-29 10:28:44,962 [noc.core.dcs.base] Set faulty status to: Timed out нашел в логах web

Gitlab
29.08.2018
05:43:48

Геннадий
29.08.2018
06:23:11

Anton
29.08.2018
06:27:09
#ищу работу
#удаленку
ищу постоянную удаленную работу системным администратором unix/linux/voip/networking и/или специалистом по информационной безопасности(ИБ).
все подробности и резюме через мой контакт в телеге: @sysbooter
С уважением,

Andrey
29.08.2018
06:49:38

Геннадий
29.08.2018
06:50:00
спасибо

Vitaliy
29.08.2018
07:06:22
Друзья привет. После миграции перестал работать глобальный поиск. Что надо пнуть?

Ivan
29.08.2018
07:07:44
Могу врать

Andrey
29.08.2018
07:08:13

Vitaliy
29.08.2018
07:08:47
ну после той которую вчера с Вами весь день долбали

Google

Andrey
29.08.2018
07:10:54

Vitaliy
29.08.2018
07:10:57

Andrey
29.08.2018
07:11:37
./noc shell
from noc.sa.models.managedobject import ManagedObject
for mo in ManagedObject.objects.filter()
mo.save()

Vitaliy
29.08.2018
07:13:07

Andrey
29.08.2018
07:13:25
Objects

Vitaliy
29.08.2018
07:14:18
то ж самое
ругается на синтаксис в конце строки

Andrey
29.08.2018
07:18:24

Vitaliy
29.08.2018
07:23:23
выполнилось
но все равно ошибку поиска выдает
имею ввиду глобальный поиск
конкретно в sa mo поиск по железякам работает

Andrey
29.08.2018
07:25:30
посмотрим

Vitaliy
29.08.2018
07:25:48
ок, понял
https://code.getnoc.com/noc/noc/issues/918

Dmitry
29.08.2018
07:36:19
Возможно сразу что то пошло не так... жду релиза, потом проверю...

Gitlab
29.08.2018
07:40:22
dv opened merge request at / noc:
mib service

Google

Gitlab
29.08.2018
07:42:48

Ivan
29.08.2018
07:45:47
У меня поиск работает, но очень херово
вываливает кучу непонятно как связанной инфы

Александр
29.08.2018
07:49:09
https://code.getnoc.com/noc/noc/issues/919

Gitlab
29.08.2018
07:53:58
dv opened merge request at / noc:
#918 Fix full-text search index
sysfaray opened merge request at / noc:
Fix get_ifindexes and get_interface_status_ex for MA5300

Fumufu86
29.08.2018
08:57:36
Отваливается на TASK [migrate : Synchronize MIBs]
установка чистая на debian8

Gitlab
29.08.2018
08:58:10

Ivan
29.08.2018
08:58:27

Fumufu86
29.08.2018
08:58:59
https://gist.github.com/fumufu86/aea0d02d9f2eea112789fdeac6e1b21e

Ivan
29.08.2018
09:00:42

Алексей
29.08.2018
09:14:18
Господа, в ноке появился новые сервис. selfmon. Задача сервиса собирать и отдавать в формате пригодном для прометея данные о самой системе. Сейчас в базовой реализации сервис умеет отдавать колво железяк с разбивкой по пулам. Не самая востребованная фнукциональность но вполне рабочая.
Рекомендации по запуску как минимум один. Если запущено будет более одного рабочим будет только один. Они через консул выберут кто главнее.
У тех у кого прометея в схеме еще нет включать сервис selfmon нет никакого смысла, но и вреда тоже нет.

Gitlab
29.08.2018
09:15:20

Ivan
29.08.2018
09:16:45
или телеграф пока остаётся?


Алексей
29.08.2018
09:19:07
телеграф никуда не девается. телеграф собирает метрики о сервере и системных компонентах.
сами ноковские демоны рассказывают о себе через /metrics endpoint. Но некоторые вещи например тот же late собрать через них нет возможности. Selfmon нужен для сбора продуктовых метрик не относящихся к другим темам. Например колво линков в ноке или колво аварий и такое