
Alexander
18.10.2016
19:31:30

kay
18.10.2016
19:53:30
у меня сегодня классический фейл был. передеплоивал приложение несколько раз, а оно работает не так как надо. пока меня пальцем не ткнули в то, что я с другим кластером работаю. вот и результат 11 часового рабочего дня
хорошо namespace был проставлен не prod

Alexander
18.10.2016
20:00:29
победил эти лимиты
LimitNOFILE=262144

Google

Alexander
18.10.2016
20:00:51
бесконечность не бесконечна для docker

kay
18.10.2016
20:01:02
эвоно как
представьте ситуацию. загружаете вы видео 1gb в некий аналог youtube. на 98% один из серверов (на котором и loadbalancer и аппликуха которая принимает это видео) подох. но у меня есть keepalived, nginx, ceph и вторая копия аппликухи на другом сервере, который через секунду стал мастером. у него есть /ceph/tmp, в котором 98% файла, предположим, где-то хранится статус этой загрузки.
теперь вопрос знатокам: как прозрачно возобновить загрузку, чтобы клиент даже и не понял, что что-то произошло? спец софт на стороне клиента? модный javascript? а если он curl'ом загружал? можно сделать прозрачную загрузку для curl?

Artem
18.10.2016
20:36:29
кажется не выйдет
ещё сессии можно перенести
а неклассифицированный трафик вряд-ли
я прикручивал ipvs балансировку с помощью викимедивской pyball
но там только http
ceph это radosgw тут?
можно попробовать связку ipvs+pyball
так сделано в 2гис
и кажется в яндекс

kay
18.10.2016
20:43:11
pyball?

Google

Artem
18.10.2016
20:43:40
да это петон от MediaWiki для управления ipvs
следит за бекендами, переносит tcp сессии балансит

kay
18.10.2016
20:45:00
keepalived умеет сесии переносить

Artem
18.10.2016
20:45:46
а сессия то есть?

kay
18.10.2016
20:45:47
не могу ничего найти на тему pyball

Artem
18.10.2016
20:45:52
ща
за компом сяду

kay
18.10.2016
20:46:07
только вот это https://github.com/boscoh/pyball
вот еще балансер https://github.com/google/seesaw

yolkov
18.10.2016
20:49:53
https://github.com/wikimedia/PyBal

kay
18.10.2016
20:50:00
но мне интересно как заставить приложение, которое занимается приемкой файла по post обмениваться всей этой информацией и сессиями с другими прилоэжениями. чтобы они на-лету смогли друг друга подменить

yolkov
18.10.2016
20:50:06
не мяч, а балансировка)

Artem
18.10.2016
20:50:56
https://wikitech.wikimedia.org/wiki/LVS
тут от приложения зависит
где она стейт хранит
в памяти?)

kay
18.10.2016
20:51:42
я делал keepalived dr для nginx, который обменивался состояними tcp сессий. но вот если загрузка большого файла - оно не помогало.

Artem
18.10.2016
20:52:03
чанками поди грузит?
можно написать прямиком сысоеву. обычно он ответчает или ктото за него )

kay
18.10.2016
20:53:01
вот мой вопрос как раз в том, есть ли такое. требуется ли кустомное ядро для этого?

Google

Artem
18.10.2016
20:53:54
а кто принимает то ? какое-то кастомное приложение? radosgw? надо смотреть имплементацию

kay
18.10.2016
20:54:14
пока никто. но нужен концепт
под ceph я подразумевал расшаренный tmp volume

Artem
18.10.2016
20:55:46
ну вот radosgw умеет балансировку искаропки
там бекенд один

kay
18.10.2016
20:56:12
читаю

Artem
18.10.2016
20:56:46
а фронтенды пофиг какие. аля s3 key-object

kay
18.10.2016
20:57:39
оно без apache никуда...

Artem
18.10.2016
20:57:56
ну можно на nginx с патчем про чанки
я такое года 4 назад делал еще ) сейчас не знаю

kay
18.10.2016
20:58:22
что за патч?

Artem
18.10.2016
20:59:29
сейчас кажется эти все патчи в апстриме есть. раньше были проблемы с continue 100 и загрузкой чанками.

Artem
18.10.2016
20:59:43
https://github.com/bobrik/docker-radosgw/blob/master/conf/nginx.conf

kay
18.10.2016
21:01:07

Artem
18.10.2016
21:07:15
ну у цефа своих проблем много, но иногда работает ок )
flamp.ru мы так делали. я уже года три как уволился а оно все работает )
там вся статика в радосгв
6 датацентров
иногда прямо датацентрами все падает
пофигу работает

Google

Artem
18.10.2016
21:09:11
ну не прям под этот проект 6 датацентров, это так, шалости )
под видео я тоже пробовал, но там другие проблемы - буфферизация нджинкса хуже, чем у апача )
да и кроссдц цеф то еще садомазо )

kay
18.10.2016
21:10:43
а если буферизацию отключить?

Artur
18.10.2016
21:12:08
кхм, я тут наткнулся на перформанс тест сети в докере от перконы, https://www.percona.com/blog/2016/08/03/testing-docker-multi-host-network-performance/
простите, что вмешиваюсьв разговор :)

Artem
18.10.2016
21:13:15
без буфферизации совсем - не выйдет. всегда есть ошибки сети, сбои у стораджа. просто будет падать клиент, а это уже святое ) раз упало два и он не придет больше )
ну так себе бенчмарк ))
вееве ваш странно зафейлился ))
мы тестили подобное в опенстеке, результаты похожие.

Admin
ERROR: S client not available

Artem
18.10.2016
21:20:12
латенси бы еще посмотреть
а не только оверхед
я вот только не пойму, они калико хотя прикопать и сделать канал? или как там его.

Artur
18.10.2016
21:26:36
по хорошему, я не вижу нигде адекватных перформанс тестов, чтобы там сетап был раскрыт полностью, графики какие-нибудь

Artem
18.10.2016
21:33:45
это надо к тру сетевикам
тесты на прикладном уровне это какие-то коровомили обычно
у нас есть лигрылы для такого случая,
литры-градусы-нарыло
)

Google

Artur
18.10.2016
21:36:36
мне по факту нужен простой в сетапе и стабильный vxlan, но как-то не вижу я счастья пока особо, с weave тоже наелся уже

Artem
18.10.2016
21:37:11
почему weeve так соснул я честно говоря не понимаю пока

Artur
18.10.2016
21:37:29
но _такой_ низкий результат

Artem
18.10.2016
21:37:58
ovs вот ещё бы потестили

Artur
18.10.2016
21:38:06
ага, там в комментах пишут
flannel/ovs

Artem
18.10.2016
21:38:25
в опенстек используется, норм
там и gre есть
но надо патчить ядро почти всегда

Artur
18.10.2016
21:38:59
безумие

Artem
18.10.2016
21:39:21
фланель надо закопать!
но работает как кирпич)

Artur
18.10.2016
21:39:55
ну ты же сам упоминал про canal
canal = calico+flannel

Artem
18.10.2016
21:40:15
я не смотрел особо
просто интересно к чему идет
calico в целом мощная и всеобъемлющая вещь

Artur
18.10.2016
21:41:24
вообще слабо представляю, как работает эта интеграция, надо видимо сесть и читать книги по сетям

Artem
18.10.2016
21:42:18
там чисто l3
pure ip network+bgp
l2 это уже инкапсуляции, оверхед, тормоза