Anonymous
Viktor Manyushin будет жить. Поприветствуем!
Victor
Коллеги, а никто не задумывался над тем, что cinder-volume не чистит за собой лок файлы? да, они 0 байт, но они все в одной директории и их очень много...
gwaewion
gwaewion
Тут вопрос: почему он этого не делает?
Victor
Потому что там нет метода удаления локов:))) скорее вопрос для чего он так делает ...
Victor
Было дело
А к чему-нибудь пришли в итоге?
gwaewion
Victor
😂😂😂👍👍
Anonymous
@snipghost будет жить. Поприветствуем!
Fox
спасайте опенстеку поплохело, доступа по сети к виртуалкам нет, горизонт не открывается
Fox
в логах нейтрона ERROR oslo.messaging._drivers.impl_rabbit [-] AMQP server on 192.168.0.3:5673 is unreachable: [Errno 111] ECONNREFUSED. Trying again in 32 seconds.
Maksim
Rabbit проверяй
Fox
root@node-53:~# ps axf | grep rabb
32127 pts/1 S+ 0:00 \_ grep --color=auto rabb
19559 ? Ss 6:26 /usr/bin/python /usr/bin/rabbit-fence.py
Fox
может рабит сервер на обоих нодах перерестартовать?
Maksim
Это ни о чем не говорит. У тебя как минимум нейтрон не может до него достучаться
Fox
=WARNING REPORT==== 25-Jul-2018::06:04:41 ===
closing AMQP connection <0.4852.0> (192.168.0.3:54398 -> 192.168.0.5:5673, vhost: '/', user: 'nova'):
client unexpectedly closed TCP connection
=WARNING REPORT==== 25-Jul-2018::09:53:57 ===
closing AMQP connection <0.4843.0> (192.168.0.3:54394 -> 192.168.0.5:5673, vhost: '/', user: 'nova'):
client unexpectedly closed TCP connection
Maksim
Проверь что порт случается и доступен, проверь что работает сам rabbit корректно
Fox
=ERROR REPORT==== 23-Aug-2018::20:16:00 ===
Error on AMQP connection <0.616.2269> (192.168.0.4:36216 -> 192.168.0.5:5673, vhost: '/', user: 'nova', state: running), channel 0:
operation none caused a connection exception connection_forced: "broker forced connection closure with reason 'shutdown'"
=ERROR REPORT==== 23-Aug-2018::20:16:00 ===
Error on AMQP connection <0.442.2269> (192.168.0.4:36214 -> 192.168.0.5:5673, vhost: '/', user: 'nova', state: running), channel 0:
operation none caused a connection exception connection_forced: "broker forced connection closure with reason 'shutdown'"
=ERROR REPORT==== 23-Aug-2018::20:16:00 ===
Error on AMQP connection <0.5247.0> (192.168.0.3:54472 -> 192.168.0.5:5673, vhost: '/', user: 'nova', state: running), channel 0:
operation none caused a connection exception connection_forced: "broker forced connection closure with reason 'shutdown'"
=ERROR REPORT==== 23-Aug-2018::20:16:00 ===
Error on AMQP connection <0.4837.0> (192.168.0.3:54390 -> 192.168.0.5:5673, vhost: '/', user: 'nova', state: running), channel 0:
operation none caused a connection exception connection_forced: "broker forced connection closure with reason 'shutdown'"
=ERROR REPORT==== 23-Aug-2018::20:16:00 ===
Error on AMQP connection <0.917.2269> (192.168.0.5:57554 -> 192.168.0.5:5673, vhost: '/', user: 'nova', state: running), channel 0:
operation none caused a connection exception connection_forced: "broker forced connection closure with reason 'shutdown'"
=INFO REPORT==== 23-Aug-2018::20:16:00 ===
Stopping message store for directory '/var/lib/rabbitmq/mnesia/rabbit@messaging-node-54/msg_store_persistent'
=INFO REPORT==== 23-Aug-2018::20:16:00 ===
Message store for directory '/var/lib/rabbitmq/mnesia/rabbit@messaging-node-54/msg_store_persistent' is stopped
=INFO REPORT==== 23-Aug-2018::20:16:00 ===
Stopping message store for directory '/var/lib/rabbitmq/mnesia/rabbit@messaging-node-54/msg_store_transient'
=INFO REPORT==== 23-Aug-2018::20:16:00 ===
Message store for directory '/var/lib/rabbitmq/mnesia/rabbit@messaging-node-54/msg_store_transient' is stopped
=INFO REPORT==== 23-Aug-2018::20:16:00 ===
Stopping application 'mnesia'
=INFO REPORT==== 23-Aug-2018::20:16:00 ===
Stopping application 'rabbit_common'
=INFO REPORT==== 23-Aug-2018::20:16:00 ===
Stopping application 'os_mon'
=INFO REPORT==== 23-Aug-2018::20:16:00 ===
Successfully stopped RabbitMQ and its dependencies
=INFO REPORT==== 23-Aug-2018::20:16:00 ===
Halting Erlang VM with the following applications:
ranch
ssl
public_key
asn1
crypto
syntax_tools
compiler
xmerl
inets
sasl
stdlib
kernel
Fox
и после этого все падает судя по всему
Fox
Stopping rabbit application on node 'rabbit@messaging-node-54'
Stopping and halting node 'rabbit@messaging-node-54'
Maksim
Ну это лог вчерашний, судя по дате
Fox
да после этого все и неработало
Fox
судя по всему
Fox
во всех службах только одно ERROR oslo.messaging._drivers.impl_rabbit [-] AMQP server on 192.168.0.5:5673 is unreachable:
Maksim
Вспоминай что менялось в это время, перезапусти, проверь сетевую доступность
Maksim
Fox
ничего не менялось его не кто ни трогает
Fox
может его стартануть?
Fox
он вроде в шатдауне
Fox
в процессах нет
Maksim
Нет, не надо запускать, просто смотри на него🙂. Ну конечно запусти
Fox
root@node-54:~# rabbitmqctl status
Status of node 'rabbit@messaging-node-54'
Error: unable to connect to node 'rabbit@messaging-node-54': nodedown
DIAGNOSTICS
===========
attempted to contact: ['rabbit@messaging-node-54']
rabbit@messaging-node-54:
* connected to epmd (port 4369) on messaging-node-54
* epmd reports: node 'rabbit' not running at all
other nodes on messaging-node-54: ['rabbitmq-cli-26']
* suggestion: start the node
current node details:
- node name: 'rabbitmq-cli-26@node-54'
- home dir: /var/lib/rabbitmq
- cookie hash: soeIWU2jk2YNseTyDSlsEA==
Fox
запустил
Fox
чтотото отвечает
Fox
новое в логах oslo_messaging.rpc.dispatcher [req-aae76a6d-7398-4c33-a5a7-4ab84ffa55ae - - - - -] Exception during message handling: (_mysql_exceptions.OperationalError) (2003, "Can't connect to MySQL server on '192.168.0.2' (113)")
Fox
EP: GMCast version 0
<27>Aug 24 05:51:14 node-54 mysqld: 2018-08-24 05:51:14 17019 [Note] WSREP: (b63c3b8f, 'tcp://192.168.0.5:4567') listening at tcp://192.168.0.5:4567
<27>Aug 24 05:51:14 node-54 mysqld: 2018-08-24 05:51:14 17019 [Note] WSREP: (b63c3b8f, 'tcp://192.168.0.5:4567') multicast: , ttl: 1
<27>Aug 24 05:51:14 node-54 mysqld: 2018-08-24 05:51:14 17019 [Note] WSREP: EVS version 0
<27>Aug 24 05:51:14 node-54 mysqld: 2018-08-24 05:51:14 17019 [Note] WSREP: gcomm: connecting to group 'openstack', peer '192.168.0.3:,192.168.0.5:'
<27>Aug 24 05:51:17 node-54 mysqld: 2018-08-24 05:51:17 17019 [Warning] WSREP: no nodes coming from prim view, prim not possible
<27>Aug 24 05:51:17 node-54 mysqld: 2018-08-24 05:51:17 17019 [Note] WSREP: view(view_id(NON_PRIM,b63c3b8f,1) memb {
<27>Aug 24 05:51:17 node-54 mysqld: b63c3b8f,0
<27>Aug 24 05:51:17 node-54 mysqld: } joined {
<27>Aug 24 05:51:17 node-54 mysqld: } left {
<27>Aug 24 05:51:17 node-54 mysqld: } partitioned {
<27>Aug 24 05:51:17 node-54 mysqld: })
<27>Aug 24 05:51:18 node-54 mysqld: 2018-08-24 05:51:18 17019 [Warning] WSREP: last inactive check more than PT1.5S ago (PT3.50231S), skipping check
<27>Aug 24 05:51:47 node-54 mysqld: 2018-08-24 05:51:47 17019 [Note] WSREP: view((empty))
<27>Aug 24 05:51:47 node-54 mysqld: 2018-08-24 05:51:47 17019 [ERROR] WSREP: failed to open gcomm backend connection: 110: failed to reach primary view: 110 (Connection timed out)
<27>Aug 24 05:51:47 node-54 mysqld: at gcomm/src/pc.cpp:connect():162
<27>Aug 24 05:51:47 node-54 mysqld: 2018-08-24 05:51:47 17019 [ERROR] WSREP: gcs/src/gcs_core.cpp:long int gcs_core_open(gcs_core_t*, const char*, const char*, bool)():206: Failed to open backend connection: -110 (Connection timed out)
<27>Aug 24 05:51:47 node-54 mysqld: 2018-08-24 05:51:47 17019 [ERROR] WSREP: gcs/src/gcs.cpp:long int gcs_open(gcs_conn_t*, const char*, const char*, bool)():1379: Failed to open channel 'openstack' at 'gcomm://192.168.0.3,192.168.0.5': -110 (Connection timed out)
<27>Aug 24 05:51:47 node-54 mysqld: 2018-08-24 05:51:47 17019 [ERROR] WSREP: gcs connect failed: Connection timed out
<27>Aug 24 05:51:47 node-54 mysqld: 2018-08-24 05:51:47 17019 [ERROR] WSREP: wsrep::connect(gcomm://192.168.0.3,192.168.0.5) failed: 7
<27>Aug 24 05:51:47 node-54 mysqld: 2018-08-24 05:51:47 17019 [ERROR] Aborting
<27>Aug 24 05:51:47 node-54 mysqld:
<27>Aug 24 05:51:47 node-54 mysqld: 2018-08-24 05:51:47 17019 [Note] WSREP: Service disconnected.
<27>Aug 24 05:51:48 node-54 mysqld: 2018-08-24 05:51:48 17019 [Note] WSREP: Some threads may fail to exit.
<27>Aug 24 05:51:48 node-54 mysqld: 2018-08-24 05:51:48 17019 [Note] Binlog end
<27>Aug 24 05:51:48 node-54 mysqld: 2018-08-24 05:51:48 17019 [Note] /usr/sbin/mysqld: Shutdown complete
<27>Aug 24 05:51:48 node-54 mysqld:
<29>Aug 24 05:51:48 node-54 mysqld_safe: mysqld from pid file /var/lib/mysql/node-54.pid ended
Fox
чтото с mysql
Fox
первый раз такие ошибки вижу
Fox
ERROR] WSREP: failed to open gcomm backend connection: 110: failed to reach primary view: 110 (Connection timed out)
Fox
это вообще что? (((
Maksim
У тебя там судя по логам галера, копать туда
Fox
Mysql лежит
Fox
<150>Aug 23 20:15:45 node-54 glance-api: 2018-08-23 20:15:45.164 27927 INFO eventlet.wsgi.server [-] 192.168.0.2 - - [23/Aug/2018 20:15:45] "GET /healthcheck HTTP/1.0" 200 137 0.003893
<150>Aug 23 20:15:48 node-54 glance-glare: 2018-08-23 20:15:48.413 21201 INFO eventlet.wsgi.server [-] 192.168.0.2 - - [23/Aug/2018 20:15:48] "OPTIONS /versions HTTP/1.0" 200 268 0.001037
Fox
больше записей нет в логе
Fox
haproxy тоже не запущен
Fox
есть желание просто перезапустить контролеры
Inna
если само всё попадало, может что-нибудь банальное, вроде места на диске?
Fox
логи под 98 %
Fox
могло из за логов призойти ?
Fox
проще наверное перезагрузить
Inna
лучше не надо перезагружать) если остаток 2% это норма, то источник проблемы может найтись в самом большом логе
Fox
поздно...
Inna
проще наверное перезагрузить
не помню с каким дистром, не получалось даже зассшиться, когда совсем заканчивалось место в /var >_<
Fox
<27>Aug 24 06:15:30 node-53 mysqld: 2018-08-24 06:15:30 13796 [Note] WSREP: wsrep_notify_cmd is not defined, skipping notification.
<27>Aug 24 06:16:10 node-53 mysqld: 2018-08-24 06:16:10 13796 [Note] WSREP: (de200977, 'tcp://192.168.0.3:4567') reconnecting to 15d37120 (tcp://192.168.0.5:4567), attempt 30
<27>Aug 24 06:16:55 node-53 mysqld: 2018-08-24 06:16:55 13796 [Note] WSREP: (de200977, 'tcp://192.168.0.3:4567') reconnecting to 15d37120 (tcp://192.168.0.5:4567), attempt 60
<27>Aug 24 06:17:39 node-53 mysqld: 2018-08-24 06:17:39 13796 [Note] WSREP: (de200977, 'tcp://192.168.0.3:4567') reconnecting to 15d37120 (tcp://192.168.0.5:4567), attempt 90
<27>Aug 24 06:18:24 node-53 mysqld: 2018-08-24 06:18:24 13796 [Note] WSREP: (de200977, 'tcp://192.168.0.3:4567') reconnecting to 15d37120 (tcp://192.168.0.5:4567), attempt 120
<27>Aug 24 06:19:09 node-53 mysqld: 2018-08-24 06:19:09 13796 [Note] WSREP: (de200977, 'tcp://192.168.0.3:4567') reconnecting to 15d37120 (tcp://192.168.0.5:4567), attempt 150
<27>Aug 24 06:19:54 node-53 mysqld: 2018-08-24 06:19:54 13796 [Note] WSREP: (de200977, 'tcp://192.168.0.3:4567') reconnecting to 15d37120 (tcp://192.168.0.5:4567), attempt 180
<27>Aug 24 06:20:39 node-53 mysqld: 2018-08-24 06:20:39 13796 [Note] WSREP: (de200977, 'tcp://192.168.0.3:4567') reconnecting to 15d37120 (tcp://192.168.0.5:4567), attempt 210
<27>Aug 24 06:20:44 node-53 mysqld_safe: A mysqld process with pid=13796 is already running. Aborting!!
<29>Aug 24 06:20:51 node-53 mysqld_safe: Starting mysqld daemon with databases from /var/lib/mysql
<29>Aug 24 06:20:51 node-53 mysqld_safe: WSREP: Running position recovery with --log_error='/var/lib/mysql/wsrep_recovery.tSA18r' --pid-file='/var/lib/mysql/node-53.euro-prestige.ru-recover.pid'
<27>Aug 24 06:20:52 node-53 mysqld: 2018-08-24 06:20:52 0 [Warning] TIMESTAMP with implicit DEFAULT value is deprecated. Please use --explicit_defaults_for_timestamp server option (see documentation for more details).
<27>Aug 24 06:20:52 node-53 mysqld: 2018-08-24 06:20:52 0 [Note] /usr/sbin/mysqld (mysqld 5.6.37-0~u14.04+mos0) starting as process 30245 ...
<29>Aug 24 06:20:56 node-53 mysqld_safe: WSREP: Recovered position e6a2cde4-d5db-11e7-8bd4-231b0c08b870:48711679
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 0 [Warning] TIMESTAMP with implicit DEFAULT value is deprecated. Please use --explicit_defaults_for_timestamp server option (see documentation for more details).
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 0 [Note] /usr/sbin/mysqld (mysqld 5.6.37-0~u14.04+mos0) starting as process 31033 ...
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 31033 [Warning] Using unique option prefix myisam_recover instead of myisam-recover-options is deprecated and will be removed in a future release. Please use the full name instead.
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 31033 [Note] Plugin 'FEDERATED' is disabled.
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 31033 [ERROR] Function 'innodb' already exists
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 31033 [Warning] Couldn't load plugin named 'innodb' with soname 'ha_innodb.so'.
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 31033 [ERROR] Function 'federated' already exists
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 31033 [Warning] Couldn't load plugin named 'federated' with soname 'ha_federated.so'.
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 31033 [ERROR] Function 'blackhole' already exists
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 31033 [Warning] Couldn't load plugin named 'blackhole' with soname 'ha_blackhole.so'.
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 31033 [ERROR] Function 'archive' already exists
<27>Aug 24 06:20:57 node-53 mysqld: 2018-08-24 06:20:57 31033 [Warning] Couldn't load plugin named 'archive' with soname 'ha_archive.so'.
Fox
блин пардон что сюда
Fox
мускулл запуститься неможет
Ruslan
Если кластер, то гуглите, как запустить развалившуюся галеру с одного узла.
Fox
урассс
Fox
базы засинкались
Fox
ВСЕМ доброе утро! всем спасибо!!!
Fox
Блин вчера день рождения было, и такой подарок)))
Inna
👍 что было-то?)
Fox
хз но есть подозрение что вчера в забилась папка логов под зовязку
Fox
пока ротация не прошла
Ruslan
В общем надо смотреть вашу разбивку дисковой системы.
Fox
Это я сразу проверил, отдельный раздел было занято 12% , а вот логи... 98% и скорее всего вчера забились полностью
Anonymous
Stanislav будет жить. Поприветствуем!
Anonymous
Алексей будет жить. Поприветствуем!
Алексей
Серьёзно тут)
Anonymous
@rkasimov будет жить. Поприветствуем!
Anonymous
@irklan будет жить. Поприветствуем!
Анатолий
Доброго времени суток
вопрос такой есть инстанс, я в нем запортачил файл /etc/network/interfaces
он пропал из сети
можно ли как нибудь другими способами войти на эту машинку?
Aleksandr
Анатолий
подскажите команду...
Анатолий
оч нужно
Aleksandr
подскажите команду...
https://docs.openstack.org/python-openstackclient/pike/cli/command-objects/console-url.html
Анатолий
отклось но на инстанс вход был по ключм