@nocproject

Страница 1246 из 2357
Иван
20.07.2017
10:32:33
При этом кликхаус явно работает root@noc:/var/log/noc# systemctl status clickhouse-server ● clickhouse-server.service - LSB: Yandex clickhouse-server daemon Loaded: loaded (/etc/init.d/clickhouse-server; bad; vendor preset: enabled) Active: active (exited) since Чт 2017-07-20 13:32:38 +11; 7h ago

Алексей
20.07.2017
10:32:49
# getent hosts clickhouse 10.36.129.73 clickhouse

Иван
20.07.2017
10:32:59
У него даже файл лога не создан.

Алексей
20.07.2017
10:33:09
для этого в /etc/hosts запись

Google
Иван
20.07.2017
10:34:07
Да черт с ним. Меня больше сислог волнует. В него теперь ничего и не приходит.

В первую очередь syslog-collector должен получать сообщение, правильно?

О, а теперь пошло. Через 10 минут после записи в логах что Service is active

Иван
20.07.2017
10:49:07
Вот оно что. root@noc:/var/log/noc# /etc/init.d/clickhouse-server status clickhouse-server: process unexpectedly terminated

fx00f
20.07.2017
10:52:21
Чё там? Чёта поправили? Обновляться пора?

Иван
20.07.2017
10:55:49
Карточки не работают

kk
20.07.2017
10:56:43
У него даже файл лога не создан.
grep errorlog /etc/clickhouse-server/config.xml

Иван
20.07.2017
10:56:55
2017-07-20 21:53:51,289 [card] GET /api/card/view/managedobject/5/ (172.16.30.161) 270.37ms 2017-07-20 21:54:40,511 [noc.core.debug] UNHANDLED EXCEPTION (2017-07-20 21:54:40.425301) BRANCH: feature/microservices TIP: bc4ed9a504da PROCESS: ./services/card/service.py ERROR FINGERPRINT: 772209ba-396b-57ba-ad87-8a5aac1e76fb WORKING DIRECTORY: /opt/noc EXCEPTION: <class 'jinja2.exceptions.UndefinedError'> '_' is undefined START OF TRACEBACK

root@noc:/var/log/noc# grep errorlog /etc/clickhouse-server/config.xml <errorlog>/var/log/clickhouse-server/clickhouse-server.err.log</errorlog> root@noc:/var/log/clickhouse-server# ls root@noc:/var/log/clickhouse-server#

Ещё по поводу карточек START OF TRACEBACK —---------------------------------------------------------------------- File: local/lib/python2.7/site-packages/jinja2/environment.py (Line: 780) Function: handle_exception 773 from jinja2.debug import make_traceback as _make_traceback 774 traceback = _make_traceback(exc_info, source_hint) 775 if rendered and self.exception_formatter is not None: 776 return self.exception_formatter(traceback) 777 if self.exception_handler is not None: 778 self.exception_handler(traceback) 779 exc_type, exc_value, tb = traceback.standard_exc_info 780 ==> reraise(exc_type, exc_value, tb) 781

kk
20.07.2017
11:11:17
Fx?f ты на микротики грешил?

Иван
20.07.2017
11:20:05
Это из-за чего может быть?

Google
Иван
20.07.2017
11:20:07
t=2017-07-20T22:19:20+1100 lvl=eror msg="Failed to update dashboard json index lstat /opt/noc/var/db/grafana_dashboards: no such file or directory"

Его там действительно нет.

fx00f
20.07.2017
11:26:41
Fx?f ты на микротики грешил?
В каком таком смысле?

Иван
20.07.2017
11:27:57
А может у меня метрики никуда не записываются из-за того, сто кликхаус не работает?

E_zombie
20.07.2017
11:28:31


kk
20.07.2017
11:30:18
В каком таком смысле?
grep -E 'Cannot close channel clearly:' /var/log/noc/activator-default-0*

E_zombie
20.07.2017
11:32:19
угу

fx00f
20.07.2017
11:32:40
а, была проблема с шедуллером, где я предположил, что забивается шедуллер из-за очень долгого опроса древних мекротов. После чего пошел и выпилил нахер ipv6 из капсов

kk
20.07.2017
11:34:34
шляпито странное. на микротах и только на get_version

fx00f
20.07.2017
11:42:43
какое ещё странное ?

Поподробне

kk
20.07.2017
11:48:34
[MikroTik.RouterOS.get_version|10.2.34.1] [ssh] Cannot close channel clearly: Unable to close the channel.

Bitbucket
20.07.2017
11:48:57
Dmitry Volodin pushed to noc/feature/chmetrics chwriter: Fix incorrect merge

Ivan
20.07.2017
11:55:21


я понял, кого она мне напоминает

Иван
20.07.2017
11:58:12
Кажется это проблема 2017-07-20 22:57:23,788 [pmwriter] Failed to spool 2500 metrics due to unknown error: type object 'pmwriter' has no attribute 'influx_db' 2017-07-20 22:57:23,788 [pmwriter] InfluxDB is getting ill. Giving chance to recover. Waiting for 1000.00ms Графана ничего не рисует, карточки не работают.

fx00f
20.07.2017
12:02:11
раз! и уплыло 6-ть гигов памяти куда-то. вот куда бля? на соседней ноде всего 2

там нет веба и графаны. всё остальное-то есть...

Google
E_zombie
20.07.2017
12:03:11
монга сожрала

fx00f
20.07.2017
12:04:13
она ваще на другой ноде

на монге 4-ре гига в буфере , всё ок

Алексей
20.07.2017
12:05:22
У тя есть графики потребления памяти каждым процессом

В инфлбксе procstat таблица

fx00f
20.07.2017
12:06:33
тадаааааам

3670.707031 Mb noc-discovery-4-def

кандидат на перезапуск

Алексей
20.07.2017
12:07:29
gcore сделай

Может @aversant посмотрит

fx00f
20.07.2017
12:07:41
а где как?

Ilya
20.07.2017
12:07:44
@freeseacher обновляться можно?*

Алексей
20.07.2017
12:08:11
@freeseacher обновляться можно?*
Будь готов решать грабли. Ну и меня до вечера не будет

а где как?
google (gcore)

Ilya
20.07.2017
12:08:33
тогда подожду :)

fx00f
20.07.2017
12:08:37
Иван
20.07.2017
12:08:48
Алексей, подскажи по pmwriter

Ладно, жду до утра.

fx00f
20.07.2017
12:11:32
google (gcore)
Далее куда его ? оно же 4-ре гига весит?

могу положить на свой FTP и ссыль заслать

Google
Алексей
20.07.2017
12:12:19
Это грабля

Убедись что в /var/spool/nsq достаточно места

Сейчас туда пишутся метрики

Но не читаются походу

fx00f
20.07.2017
12:13:08
а я CH для чего ставил вот ?

места достаточно

Алексей
20.07.2017
12:15:10
Получив добро от @aversant что посмотрит

В телеге ограничение на файл 2 гига

Будь готов что там пароли и вот это вот всё

Admin
ERROR: S client not available

Алексей
20.07.2017
12:15:36
Ладно, жду до утра.
Про место это тебе

fx00f
20.07.2017
12:15:42
Будь готов что там пароли и вот это вот всё
пароли от чего? от внутренностей нока?

Алексей
20.07.2017
12:15:50
От чего угодно

Это дамп процесса

fx00f
20.07.2017
12:16:06
процесса дискавера

какими ещё паролями он может оперировать-то?

А блять

от железа же

тогда нафиг пока что))))

Google
fx00f
20.07.2017
12:17:31
после gcore место само расчистилось как бы

а, ну его ребутнуло. Всё честно discovery-default:discovery-default-04 RUNNING pid 23905, uptime 0:10:07

Алексей
20.07.2017
12:22:07
Gcore ничего не чинит

Только делает срез

fx00f
20.07.2017
12:22:44
я и не говорил про починку. память освободилась после рестарта процесса

Иван
20.07.2017
12:24:18
kk
20.07.2017
12:41:49
рестартани инфлюкс. почини кликхаус, сделай ./noc migrate-ch =)

Алексей
20.07.2017
13:06:45
Не поможет это.

fx00f
20.07.2017
13:34:23
Лишь пройдя путь наполненного страданий и боли, лишь тогда ты сможешь ощутить настроящую, неполживую радость от использования НОКа в продакшене.

Но это не точно...

E_zombie
20.07.2017
13:37:36


fx00f
20.07.2017
13:37:40
@freeseacher у меня остались парочка файлов, имеющих в своём названии упоминание о pmwriter, датируемых 12-м чистом сего месяца. Я так понимаю, что их можно сносить?

где-то тогда же я ставил КХ

TeMP
20.07.2017
14:38:23
https://translate.google.ru/m/translate#en/ru/%5B4%5D%20mount%20-t%20tmpfs%20mdev%20%2Fdev%0A%5B5%5D%20mkdir%20%2Fdev%2Fpts%0A%5B6%5D%20mount%20-t%20devpts%20devpts%20%2Fdev%2Fpts

Sergey
20.07.2017
15:21:56
кто-то помог улучшить перевод :)

Bitbucket
20.07.2017
20:04:26
Aleksey Shirokih pushed to noc/feature/microservices move noc installation forward. just after everyting else

Aleksey Shirokih pushed to noc/feature/microservices better tasks ordering

Aleksey Shirokih pushed to noc/feature/microservices temporary disable auth for ch

Aleksey Shirokih pushed to noc/feature/microservices expose clickhouse service to consul

Aleksey Shirokih pushed to noc/feature/microservices post_install hacks

Aleksey Shirokih pushed to noc/feature/microservices fix handling incorrect hostname

Aleksey Shirokih pushed to noc/feature/microservices fix handling incorrect hostname 2

Иван
20.07.2017
21:06:46
Не поможет это.
А что поможет?

Страница 1246 из 2357