@nocproject

Страница 1682 из 2357
Ivan
27.12.2017
07:52:57
я тебя спросил про сам sae и его треды

упирался ли ты в него

E_zombie
27.12.2017
07:53:10
у тебя потоков дискавери должно быть стока же сколько и сае.

Ivan
27.12.2017
07:53:45
Почему я только сейчас об этом узнаю?

Google
Ivan
27.12.2017
07:54:22
причём со всех пулов?

E_zombie
27.12.2017
07:55:31
у тебя в консуле слоты все заняты ?



Ivan
27.12.2017
07:56:29
сцука, как там найти?

E_zombie
27.12.2017
07:56:32
там не должно быть пустых кавычек и в логах дискавери что все слоты заняты.







и листай всамый низ

Ivan
27.12.2017
07:58:14
у меня кол-во слотов в манифексте совпадает с тем, что указао в башне в инстансах

бекапных у меня нет

Ivan
27.12.2017
08:02:41
сае-то тут при чём, зомбии

Google
Ivan
27.12.2017
08:03:41




E_zombie
27.12.2017
08:13:25
лолд

Andrey
27.12.2017
08:23:55
заходишь в влан и там карточка есть

а так - глянь в лог дискавери

там будет Creating VLAN

Ivan
27.12.2017
08:25:07
заходишь в влан и там карточка есть
но там нет, откуда. Сейчас поищу в логах.

там будет Creating VLAN
прям номер будет7

Andrey
27.12.2017
08:25:34
прям номер будет7
да. Будет видно на каком устройстве дискавери прошёл первым

Ivan
27.12.2017
08:27:12
Может, они у меня давно были?

VLAN discovery is disabled for segment 'Mihaylovka'. Skipping ладно, покурим.

Ilya
27.12.2017
08:29:26


Discovered at

Ivan
27.12.2017
08:30:36
я косячник, я в Virtual Circuits пялился

Pavel
27.12.2017
08:31:27
Коллеги, снимите плиз с ручника, чет я ничего не понимаю. НОК по 443 отдает 500 ошибку. В логах нгинкса "connect() failed (111: Connection refused)", но оба noc-web процесса живы и даже отдываются на http на своиз портах.

E_zombie
27.12.2017
08:31:45
дёрни консул и потом веб

Pavel
27.12.2017
08:32:37
рестарт нока все вертает к жизни, примерно на сутки

Google
Pavel
27.12.2017
08:33:55
root@noc1:/var/log# netstat -nap | grep web tcp 0 0 91.151.201.45:25853 0.0.0.0:* LISTEN 31569/noc-web tcp 0 0 91.151.201.45:27635 0.0.0.0:* LISTEN 31568/noc-web

root@noc1:/var/log# cat /etc/nginx/upstream.conf # That file is managed by consul-template. # # Please do not edit. upstream noc-web { server 91.151.201.45:27635 weight=1 max_fails=3 fail_timeout=10; server 91.151.201.45:25853 weight=1 max_fails=3 fail_timeout=10; }

вроде даже правда

Andrey
27.12.2017
08:37:27
в логах процессов веб отображаются записи о запросах?

Pavel
27.12.2017
08:38:33
по прямым портам - да, от нгинкса - нет

Andrey
27.12.2017
08:38:44
гм.... странно

Pavel
27.12.2017
08:38:54
телнет локально на их листен адреса проходит и всплывает в логах

Andrey
27.12.2017
08:38:59
а что в логах nginx ?

Pavel
27.12.2017
08:39:15
рефузед и все на этом

Andrey
27.12.2017
08:40:33
если перезапустить nginx, то это не поможет?

Pavel
27.12.2017
08:42:02
неа, уже подергал, и web-ы отдельно вырезал из конфигов, оба говрят одно и тоже

а, стоп, это авторизация улетает....

upstream: "http://127.0.0.1:65535/api/auth/auth/"

а что там должно жить?

Ivan
27.12.2017
08:43:51
логин?

Pavel
27.12.2017
08:44:26
root@noc1:/var/log/nginx# netstat -nap | grep logi tcp 0 0 91.151.201.45:39930 0.0.0.0:* LISTEN 31566/noc-login- tcp 0 0 91.151.201.45:21357 0.0.0.0:* LISTEN 31567/noc-login-

оно?

тогда вопрос, почему consil может думать, что оно должно жить на порту 65535?

Ivan
27.12.2017
08:47:05
Да, скорее всего он. а ты какую страницу открываешь? попробуй начало открыть

Google
Pavel
27.12.2017
08:47:59
корень

Pavel
27.12.2017
08:48:17
не в логинах дело, консил травит нгинкс не на те порты

на 65535 нет ничего и быть не может

походу валится условие {{range service "login"}} в шаблоне

понять-бы почему

я к сожалению не знаю что это за зверь такой. Никто не знает/помнит относительно чего это условие проверяется?

Ivan
27.12.2017
08:51:15
Pavel
27.12.2017
08:51:29
noc.error.log

нгинкса

Ivan
27.12.2017
08:51:57
у тебя консул-темплейт должен раотать, чтобы хорошо быо

мб он косячит?

Pavel
27.12.2017
08:52:40
ну походу он и косячит

только не пойму чего ему не хватает для счастья

он работает

его рестарт никчему не приводит

Ivan
27.12.2017
08:57:24
тебе сможет помочь Алексей, потереби его после того, как очнётся

я не шарю в механизме вот этом

Pavel
27.12.2017
08:58:58
"/etc/nginx/conf.d/noc.conf" - этот файлик перегенерится постоянно?

да, рестарт всего нока вернул все к жизни

Google
Pavel
27.12.2017
09:06:42
noc stop выплюнуло в логи вот это Dec 27 12:03:24 noc1 consul-template[1771]: 2017/12/27 09:03:24.819706 [WARN] (view) health.service(login|passing): Get http://consul:8500/v1/health/service/login?index=1714296&passing=1&stale=&wait=60000ms: dial tcp 127.0.0.1:8500: getsockopt: connection refused (retry attempt 1 after "250ms") Dec 27 12:03:25 noc1 consul-template[1771]: 2017/12/27 09:03:25.070058 [WARN] (view) health.service(login|passing): Get http://consul:8500/v1/health/service/login?index=1714296&passing=1&stale=&wait=60000ms: dial tcp 127.0.0.1:8500: getsockopt: connection refused (retry attempt 2 after "500ms") Dec 27 12:03:25 noc1 consul-template[1771]: 2017/12/27 09:03:25.571296 [WARN] (view) health.service(login|passing): Get http://consul:8500/v1/health/service/login?index=1714296&passing=1&stale=&wait=60000ms: dial tcp 127.0.0.1:8500: getsockopt: connection refused (retry attempt 3 after "1s") Dec 27 12:03:57 noc1 consul-template[1771]: 2017/12/27 09:03:57.126009 [WARN] (view) health.service(login|passing): Get http://consul:8500/v1/health/service/login?index=1714296&passing=1&stale=&wait=60000ms: EOF (retry attempt 4 after "2s") Dec 27 12:03:59 noc1 consul-template[1771]: 2017/12/27 09:03:59.126713 [WARN] (view) health.service(login|passing): Get http://consul:8500/v1/health/service/login?index=1714296&passing=1&stale=&wait=60000ms: dial tcp 127.0.0.1:8500: getsockopt: connection refused (retry attempt 5 after "4s")

похоже что консул думает что логин кончился, и вырезает его отовсюду

но логин жив

Алексей
27.12.2017
11:03:12
consul-template попробовать перезапустить
Нет, пока не было ситуаций кроме фряхи когда это помогает.

похоже что консул думает что логин кончился, и вырезает его отовсюду
Если консул так думает значит он прав. Как вариант проверить не было ли у тя косяков в логах логина

Dmitry
27.12.2017
11:15:07
ух написали

давайте по шагам

workflow default состоит ровно из одного состояния

и характеризует ситуацию до wf

когда состояний не было

он ставится по дефолту

default resource более сложный

он позволяет бронировать ресурсы на время

и возвращать давно не используемые в отстойник и обратно в свободные

как раз то, что нужно для discovery

можно рисовать и свои процессы

пока в 3 приложениях

но я готовлю задание на графический редактор

vcdomain не сегмент, строго говоря

у сегмента есть признак vlan border

Страница 1682 из 2357