
Иван
20.07.2017
10:32:33
При этом кликхаус явно работает
root@noc:/var/log/noc# systemctl status clickhouse-server
● clickhouse-server.service - LSB: Yandex clickhouse-server daemon
Loaded: loaded (/etc/init.d/clickhouse-server; bad; vendor preset: enabled)
Active: active (exited) since Чт 2017-07-20 13:32:38 +11; 7h ago

Алексей
20.07.2017
10:32:49
# getent hosts clickhouse
10.36.129.73 clickhouse

Иван
20.07.2017
10:32:59
У него даже файл лога не создан.

Алексей
20.07.2017
10:33:09
для этого в /etc/hosts запись

Google

Иван
20.07.2017
10:34:07
Да черт с ним. Меня больше сислог волнует. В него теперь ничего и не приходит.
В первую очередь syslog-collector должен получать сообщение, правильно?
О, а теперь пошло. Через 10 минут после записи в логах что Service is active

kk
20.07.2017
10:48:09

Иван
20.07.2017
10:49:07
Вот оно что.
root@noc:/var/log/noc# /etc/init.d/clickhouse-server status
clickhouse-server: process unexpectedly terminated

fx00f
20.07.2017
10:52:21
Чё там? Чёта поправили? Обновляться пора?

Иван
20.07.2017
10:55:49
Карточки не работают

kk
20.07.2017
10:56:43


Иван
20.07.2017
10:56:55
2017-07-20 21:53:51,289 [card] GET /api/card/view/managedobject/5/ (172.16.30.161) 270.37ms
2017-07-20 21:54:40,511 [noc.core.debug] UNHANDLED EXCEPTION (2017-07-20 21:54:40.425301)
BRANCH: feature/microservices TIP: bc4ed9a504da
PROCESS: ./services/card/service.py
ERROR FINGERPRINT: 772209ba-396b-57ba-ad87-8a5aac1e76fb
WORKING DIRECTORY: /opt/noc
EXCEPTION: <class 'jinja2.exceptions.UndefinedError'> '_' is undefined
START OF TRACEBACK
root@noc:/var/log/noc# grep errorlog /etc/clickhouse-server/config.xml
<errorlog>/var/log/clickhouse-server/clickhouse-server.err.log</errorlog>
root@noc:/var/log/clickhouse-server# ls
root@noc:/var/log/clickhouse-server#
Ещё по поводу карточек
START OF TRACEBACK
—----------------------------------------------------------------------
File: local/lib/python2.7/site-packages/jinja2/environment.py (Line: 780)
Function: handle_exception
773 from jinja2.debug import make_traceback as _make_traceback
774 traceback = _make_traceback(exc_info, source_hint)
775 if rendered and self.exception_formatter is not None:
776 return self.exception_formatter(traceback)
777 if self.exception_handler is not None:
778 self.exception_handler(traceback)
779 exc_type, exc_value, tb = traceback.standard_exc_info
780 ==> reraise(exc_type, exc_value, tb)
781


kk
20.07.2017
11:11:17
Fx?f ты на микротики грешил?

Иван
20.07.2017
11:20:05
Это из-за чего может быть?

Google

Иван
20.07.2017
11:20:07
t=2017-07-20T22:19:20+1100 lvl=eror msg="Failed to update dashboard json index lstat /opt/noc/var/db/grafana_dashboards: no such file or directory"
Его там действительно нет.

fx00f
20.07.2017
11:26:41

Алексей
20.07.2017
11:27:13

Иван
20.07.2017
11:27:57
А может у меня метрики никуда не записываются из-за того, сто кликхаус не работает?

E_zombie
20.07.2017
11:28:31

kk
20.07.2017
11:30:18

fx00f
20.07.2017
11:31:22

E_zombie
20.07.2017
11:32:19
угу

fx00f
20.07.2017
11:32:40
а, была проблема с шедуллером, где я предположил, что забивается шедуллер из-за очень долгого опроса древних мекротов. После чего пошел и выпилил нахер ipv6 из капсов

kk
20.07.2017
11:34:34
шляпито странное. на микротах и только на get_version

fx00f
20.07.2017
11:42:43
какое ещё странное ?
Поподробне

kk
20.07.2017
11:48:34
[MikroTik.RouterOS.get_version|10.2.34.1] [ssh] Cannot close channel clearly: Unable to close the channel.

Bitbucket
20.07.2017
11:48:57
Dmitry Volodin pushed to noc/feature/chmetrics
chwriter: Fix incorrect merge

Ivan
20.07.2017
11:55:21
я понял, кого она мне напоминает

Иван
20.07.2017
11:58:12
Кажется это проблема
2017-07-20 22:57:23,788 [pmwriter] Failed to spool 2500 metrics due to unknown error: type object 'pmwriter' has no attribute 'influx_db'
2017-07-20 22:57:23,788 [pmwriter] InfluxDB is getting ill. Giving chance to recover. Waiting for 1000.00ms
Графана ничего не рисует, карточки не работают.

fx00f
20.07.2017
12:02:11
раз! и уплыло 6-ть гигов памяти куда-то. вот куда бля? на соседней ноде всего 2
там нет веба и графаны. всё остальное-то есть...

Google

E_zombie
20.07.2017
12:03:11
монга сожрала

fx00f
20.07.2017
12:04:13
она ваще на другой ноде
на монге 4-ре гига в буфере , всё ок

Алексей
20.07.2017
12:05:22
У тя есть графики потребления памяти каждым процессом
В инфлбксе procstat таблица

fx00f
20.07.2017
12:06:33
тадаааааам
3670.707031 Mb noc-discovery-4-def
кандидат на перезапуск

Алексей
20.07.2017
12:07:29
gcore сделай
Может @aversant посмотрит

fx00f
20.07.2017
12:07:41
а где как?

Ilya
20.07.2017
12:07:44
@freeseacher обновляться можно?*

Алексей
20.07.2017
12:08:11

Ilya
20.07.2017
12:08:33
тогда подожду :)

fx00f
20.07.2017
12:08:37

Иван
20.07.2017
12:08:48
Алексей, подскажи по pmwriter
Ладно, жду до утра.

fx00f
20.07.2017
12:11:32
могу положить на свой FTP и ссыль заслать

Google

Алексей
20.07.2017
12:12:19
Это грабля
Убедись что в /var/spool/nsq достаточно места
Сейчас туда пишутся метрики
Но не читаются походу

fx00f
20.07.2017
12:13:08
а я CH для чего ставил вот ?
места достаточно

Алексей
20.07.2017
12:15:10
Получив добро от @aversant что посмотрит
В телеге ограничение на файл 2 гига
Будь готов что там пароли и вот это вот всё

Admin
ERROR: S client not available

Алексей
20.07.2017
12:15:36

fx00f
20.07.2017
12:15:42

Алексей
20.07.2017
12:15:50
От чего угодно
Это дамп процесса

fx00f
20.07.2017
12:16:06
процесса дискавера
какими ещё паролями он может оперировать-то?
А блять
от железа же
тогда нафиг пока что))))

Google

fx00f
20.07.2017
12:17:31
после gcore место само расчистилось как бы
а, ну его ребутнуло. Всё честно discovery-default:discovery-default-04 RUNNING pid 23905, uptime 0:10:07

Алексей
20.07.2017
12:22:07
Gcore ничего не чинит
Только делает срез

fx00f
20.07.2017
12:22:44
я и не говорил про починку. память освободилась после рестарта процесса

Иван
20.07.2017
12:24:18

kk
20.07.2017
12:41:49
рестартани инфлюкс. почини кликхаус, сделай ./noc migrate-ch
=)

Алексей
20.07.2017
13:06:45
Не поможет это.

fx00f
20.07.2017
13:34:23
Лишь пройдя путь наполненного страданий и боли, лишь тогда ты сможешь ощутить настроящую, неполживую радость от использования НОКа в продакшене.
Но это не точно...

E_zombie
20.07.2017
13:37:36

fx00f
20.07.2017
13:37:40
@freeseacher у меня остались парочка файлов, имеющих в своём названии упоминание о pmwriter, датируемых 12-м чистом сего месяца. Я так понимаю, что их можно сносить?
где-то тогда же я ставил КХ

TeMP
20.07.2017
14:38:23
https://translate.google.ru/m/translate#en/ru/%5B4%5D%20mount%20-t%20tmpfs%20mdev%20%2Fdev%0A%5B5%5D%20mkdir%20%2Fdev%2Fpts%0A%5B6%5D%20mount%20-t%20devpts%20devpts%20%2Fdev%2Fpts

Sergey
20.07.2017
15:21:56
кто-то помог улучшить перевод :)

Bitbucket
20.07.2017
20:04:26
Aleksey Shirokih pushed to noc/feature/microservices
move noc installation forward. just after everyting else
Aleksey Shirokih pushed to noc/feature/microservices
better tasks ordering
Aleksey Shirokih pushed to noc/feature/microservices
temporary disable auth for ch
Aleksey Shirokih pushed to noc/feature/microservices
expose clickhouse service to consul
Aleksey Shirokih pushed to noc/feature/microservices
post_install hacks
Aleksey Shirokih pushed to noc/feature/microservices
fix handling incorrect hostname
Aleksey Shirokih pushed to noc/feature/microservices
fix handling incorrect hostname 2

Иван
20.07.2017
21:06:46