
Maxym
25.08.2018
21:28:16
дак вот как так: https://t.me/devops_ru/422290
А вот так. Все забагованое, насколько я понял.
Просто одно у одних работает лучше а у других хуже. Мьі с DM на overlay2 переехали так как в мапере есть баг по забиванию места временньіми файлами, если имадж слишком большой
Он там скачивает, крешится, качает заново и так пока не займет все место на диске

Vasiliy
25.08.2018
21:29:26
Вернусь, как будут какие-то годные результаты.

Google

Vasiliy
25.08.2018
21:30:55
Еще я сходу спрошу - какое значение backlog используете для нагруженных сервисов ?
1024 не хватает, 10к - вешает приложение.
(это всё сырое - тесты еще делаю, это не быстро)

Эдуард
25.08.2018
21:37:30
Деплоил давно и неправда
просто ансиблом катается фикс
В автомате

Konstantin
25.08.2018
22:11:47

Vasiliy
25.08.2018
22:13:37

Konstantin
25.08.2018
22:18:09
А какой-то драйвер используется? Storage plugin?
Или просто docker run?

Marian
25.08.2018
22:25:25

Dmitry
25.08.2018
22:26:53
Кстати. А родной гластер драйвер вообще существует? И есть ли смысл запариваться?

Vasiliy
25.08.2018
22:27:06

Google

Dmitry
25.08.2018
22:27:51

Vasiliy
25.08.2018
22:27:52

Dmitry
25.08.2018
22:28:28

Konstantin
25.08.2018
22:28:39

Marian
25.08.2018
22:28:51

Konstantin
25.08.2018
22:29:51

Marian
25.08.2018
22:30:01

Dmitry
25.08.2018
22:30:03

Marian
25.08.2018
22:31:09

Dmitry
25.08.2018
22:31:32

Vasiliy
25.08.2018
22:31:38

Marian
25.08.2018
22:32:04

Dmitry
25.08.2018
22:32:19

Vasiliy
25.08.2018
22:32:22

Dmitry
25.08.2018
22:32:36

Konstantin
25.08.2018
22:33:49

Dmitry
25.08.2018
22:34:09

Marian
25.08.2018
22:34:53

Google

Marian
25.08.2018
22:35:40
Чего?
Дание зеркало или розделени по нодам?

Dmitry
25.08.2018
22:36:29
http://jrs-s.net/2015/02/03/will-zfs-and-non-ecc-ram-kill-your-data/
Это разве уже не актуально

Vasiliy
25.08.2018
22:37:16
У разных контейнеров разные требования?)
+ @AutomationD
В том и вопрос - один вопрос, когда для контейнера хотим "сетевую ФС", для persistance - разные storage-драйвера понятны.
А на локалхосте зачем ?
Просто предлагаю разделить локальные ФС от сетевых ФС.

Marian
25.08.2018
22:37:41

Vasiliy
25.08.2018
22:38:07

Konstantin
25.08.2018
22:40:05

Alexander
25.08.2018
22:41:16

Vasiliy
25.08.2018
22:41:26
Странное предложение
Хм, имхо. в треде смешались разные концепции, поэтому и пошло предложение разделить локалхост от сетевых ФС.
Чтобы не тратить время, можем в привате определиться в терминах.

Marian
25.08.2018
22:41:28

Konstantin
25.08.2018
22:42:45

Konstantin
25.08.2018
22:43:29
Там образы и временные данные от стейтлесс, пох на них

Vasiliy
25.08.2018
22:44:10

Konstantin
25.08.2018
22:44:40
Не пропустил, но не понял меня) что ты там хранишь то?

Marian
25.08.2018
22:45:15

Vasiliy
25.08.2018
22:46:18
Вернее sas, но разницы там ..

Konstantin
25.08.2018
22:47:20
Хм, явно не в фс и докере проблема. Я даже постгри держал ext4+overlay2 и всё это в ceph

Google

Konstantin
25.08.2018
22:47:41
Никаких проблем с io

Alexander
25.08.2018
22:48:13

Admin
ERROR: S client not available

Konstantin
25.08.2018
22:49:22
А что за логи? Контейнеры генерят? Этож сколько нужно, чтобы диск ложить

Dmitry
25.08.2018
22:49:51

Vasiliy
25.08.2018
22:50:12
Ща опишу.

Konstantin
25.08.2018
22:50:32

Marian
25.08.2018
22:52:16

Vasiliy
25.08.2018
22:54:29
Смотрите.
У меня знатное подозрение, что я где-то не вижу чего-то очевидного.
Я пытаюсь грузить приложение по вебсокетам.
Прямо сейчас у меня 8(!) клиентов, которые параллельно грузят python-sanic приложение, которое в свою очередь стучится к базам(psql, redis, elastic) и приложению на nodejs.
Я вижу загрузку на iowait + si, но не критичную - < 10% в сумме.
Всё в докере, я сейчас проверяю, что дело не в нём.
История такая - если у меня мало в backlog - я вижу, что начинают отправляться syncookies
Если я выкручиваю локальный backlog приложения - примерно через 2 часа приложение перестаёт принимать соединения.
Пока я не смог через отладчики получить понятной информации - что именно там происходит.

Marian
25.08.2018
22:56:04

Vasiliy
25.08.2018
22:56:16

Marian
25.08.2018
22:57:33


Alexander
25.08.2018
22:57:55
Смотрите.
У меня знатное подозрение, что я где-то не вижу чего-то очевидного.
Я пытаюсь грузить приложение по вебсокетам.
Прямо сейчас у меня 8(!) клиентов, которые параллельно грузят python-sanic приложение, которое в свою очередь стучится к базам(psql, redis, elastic) и приложению на nodejs.
Я вижу загрузку на iowait + si, но не критичную - < 10% в сумме.
Всё в докере, я сейчас проверяю, что дело не в нём.
История такая - если у меня мало в backlog - я вижу, что начинают отправляться syncookies
Если я выкручиваю локальный backlog приложения - примерно через 2 часа приложение перестаёт принимать соединения.
Пока я не смог через отладчики получить понятной информации - что именно там происходит.
syncookies высылаются при заполнении syn queue, а backlog — это accept queue. вам другое крутить надо.
@BaZZiliO попробуйте увеличить net.ipv4.tcp_max_syn_backlog

Vasiliy
25.08.2018
23:02:29

Alexander
25.08.2018
23:04:38

Vasiliy
25.08.2018
23:09:25
Стоп, accept очередь на 8 клиентах у меня точно переполниться не могла.
оно там асинхронное всё, конечно, но нет.

Google

Alexander
25.08.2018
23:16:23

Vasiliy
25.08.2018
23:18:28
Исправил слова - внешний сервис => отдельный docker-сервис.

Alexander
25.08.2018
23:22:22

Vasiliy
25.08.2018
23:26:12

Никита
25.08.2018
23:28:18
Мимо-предложу кстати посмотреть нагрузку по ядрам, типа mpstat -P ALL

Alexander
25.08.2018
23:28:52

Vasiliy
25.08.2018
23:29:18

Alexander
25.08.2018
23:30:07

Vasiliy
25.08.2018
23:32:24
Мимо-предложу кстати посмотреть нагрузку по ядрам, типа mpstat -P ALL
Да, ядра перегружены python-приложением.
Возможно, оно тут теряет какие-то ресурсы.
Сейчас делаю через балансировщик, чтобы в одно ядро/процесс было не более 10 запросов (меньше - убивает всю идею асинхронности).
Кроме haproxy что такое может позволить ?)
Меня сильно смущает, что python-asyncio приложения говорят - нам не нужен gunicorne - мы и так лучше.
Пока это не очевидно.
Исправил - некоторую конкуренцию для async-приложений нужно создавать.
Что делать с кучей вебсокетов (каждый - отдельное tcp-соединение и питону с нодой становится плохо) - вопрос.