
banuchka
30.09.2016
13:56:21
service_ip, который на поды по rr что-то слать начнет - почти гарант того, что сеть(физически) кончится на машине, куда приземляется этот ip
ну а дальше про все эти “небольшие оверхеды” по той же сети… тут чуток, там маленько и на выходе у нас уже не очень приятные цифры, которые мы можем получить накрутив все эти слои.

Magistr
30.09.2016
13:58:46

Andrey
30.09.2016
13:58:53
ну и как, как они делают продукты в 2016 без IPv6 :(

Google

banuchka
30.09.2016
13:59:21

Evgeny
30.09.2016
13:59:24
любовно!

banuchka
30.09.2016
14:00:39
потом еще возникает интересный момент: stateful контейнеры
т.е. нужен сторадж… т.е. это у нас nfs, iscsi, glusterfs, ceph
и начинаются новые горизонты

Magistr
30.09.2016
14:06:39

banuchka
30.09.2016
14:08:57
хотел бы я, чтобы кибернетис их решал мне. но пока что-то нет.

Magistr
30.09.2016
14:13:58
стейтфул да известная проблема, но и для них есть старые добрые виртуалки

banuchka
30.09.2016
14:15:49
не, погоди - что решает в данном контексте виртуалка?

Magistr
30.09.2016
14:17:31

banuchka
30.09.2016
14:18:54
я говорю о том, что pod может уметь переезжать на другую ноду - это отлично. Но для того, чтобы это работало я написал про сторадж.
изучение/внедрение которого тянет за собой массу всего.

Google

ptchol
30.09.2016
14:21:55
Антон, а как вы решаете эту проблему со стородом ? хранилка + flocker ?
*хранилкой

banuchka
30.09.2016
14:22:35
да вот особо никак не решаем

Evgeny
30.09.2016
14:22:46
просто ничего не помнят :)

banuchka
30.09.2016
14:23:15
как минимум нет решения, про которое я бы мог сказать, что за него не сильно стыдно, его просто настроить и оно применимо.
и больше всего меня огорчает факт того, что я пока не вижу чего-то вменяемого для этой хотелки, блин.

N
30.09.2016
15:31:40

Il
30.09.2016
15:32:03

banuchka
30.09.2016
15:32:43
неа, про первое слышал от кого-то давно, про второе - не слышал
да и как-то не хочется сразу чего-то энтерпрайзного, большого и где все по заявлениям отлично
хочется на базе чего-то общепонятного и известного, чтобы как минимум максимально понимать происходящее
ибо практика говорит о том, что как только что-то готовое работать перестает ожидаемо - копать это и разбирать не всегда тривиально

Il
30.09.2016
15:34:54
мы сейчас смотрим на эти два. Еще специалистка про Docker Storage из некоей консалтинговой конторы Gartner мне рекомендовала посмотреть на Portworx, StorageOS или Blockbridge, но последние два скорее из-за наших специфичных требований на шифрование.

N
30.09.2016
15:35:54

Il
30.09.2016
15:37:02
В нем через полгодика будет какой-то встроенный сторидж тоже, кстати

banuchka
30.09.2016
15:38:13
про ранчер знаю, да… но чот пока не зашел.

N
30.09.2016
15:38:20
о, спасибо
надо будет запомнить ранчер и попробовать в деле

Google

N
30.09.2016
15:40:13
почему придется?
потому что количество сервисов и частота деплоев растет, кастомные решения приходится писать самому, а в других местах это уже решено

banuchka
30.09.2016
15:41:05
ну вот как-то пока на данный момент решено там меньше, чем хотелось бы, если смотреть на текущие реалии.
ну и опять-таки кибернетис – это не что-то энтырпрайзное и т.д.

N
30.09.2016
15:41:57
а что энтерпрайзное по-твоему?
у нас вот есть свой тулчейн на основе docker-compose и cloud formation, он хорош, но хочется перейти к более централизованному подходу

banuchka
30.09.2016
15:45:01
по гуглению “Не смотрели Virtuozo или Hedwig?” - похоже на “что-то энтерпрайзное“
vsphere - отличный вариант
как пример энтерпрайза.

Il
30.09.2016
16:18:07
ну k8s интегрируется в EBS и гугловским стораджем
Это хороший вариант. Вообще говоря любая система, поддерживающая докер сторадж-драйверы поддерживает все клаудные стораджа.
Фишка Ранчер-стораджа (которого зовут Лонгхорн) в том, что он сам создает клаудный сторадж из вашего железа. Они это и называют “On-premise EBS”
Насколько я понимаю, сейчас есть 5 “энтерпрайз” решений для Докера: AWS ECC, Mesos, GCC k8s, Rancher, Docker DC
Есть еще всякие опенстеки, которые так же умеют как-то запускать контейнеры, но там все совсем несерьезно, и их стоит брать только за другую функциональность

banuchka
30.09.2016
16:21:52
“Фишка Ранчер-стораджа (которого зовут Лонгхорн) в том, что он сам создает клаудный сторадж из вашего железа.”
но все мы понимаем, что чудес не бывает… и что на меди 1г, нормального стораджа врядли заиметь получится

Il
30.09.2016
16:24:57
@banuchka смотря для каких нужд он вам нужен. но вообще я требования 1г не учитывал, конечно. А на 10+ вполне может работать.

banuchka
30.09.2016
16:25:50
10г - это минимально требование, в том то и дело. Проблема в том, что на существующем парке это выливается тоже в затраты, чтобы получить 10г хотяб на кусок, где мне это нужно
нужда простая: пусть три апп-ноды, распределенное хранилище + переезд аппы в случае падения, с теми данными, что были на пред. ноде где оно работало.
без учета даунтайма на up/down аппы

Il
30.09.2016
16:27:48
RPO?

banuchka
30.09.2016
16:29:20
что? ну можно еще учесть, что аппа в процессе работы делает снепшоты в синхронном треде, т.е. совсем плохим io там сделать нельзя, а иначе задача бы сильно упростилась
допустим, что устроит 80% от RAID1+0 из 4х 10k SAS

Google

Il
30.09.2016
16:46:19
RPO - recovery point objective. Сколько данных готовы потерять в случае отказа оборудования

Magistr
30.09.2016
16:49:04
тогда можно вешаться вообще
незнаю у меня счас на проекте сервис состоит из пикселя, веб уи, и 4х рест бекэндов, все это можно пихать в докер если надо проскейлиться, за этим конечно стоит база, но зачем мне базу в докер когда есть RDS

N
30.09.2016
16:59:32
да, но не все задачи решает rds
иногда надо процессить сырые данные, которые приходят в виде файлов, например

Magistr
30.09.2016
17:08:50
emr же на спот инстансах
прочитал с с3 положил в базу или опять в с3

N
30.09.2016
17:12:33
не очень охота спорить, но у этого тоже есть ограничения
хотя у нас есть продукт для этого, отлично работает, складывает в redshift

Admin
ERROR: S client not available

N
30.09.2016
17:14:20
но редшифт стоит очень дорого

Magistr
30.09.2016
17:15:30
ну да варианты могут быть разными

N
30.09.2016
17:16:25
на нашем трафике emr будет тормозить, поэтому у нас костыли

Magistr
30.09.2016
17:18:39
а какого типа трафик ?

N
30.09.2016
17:18:45
вообще есть kinesis, но он тоже дорогой
2.5 терабайта логов в месяц

Magistr
30.09.2016
17:20:04
хм у нас было 20Г логов в день

N
30.09.2016
17:21:18
это не логи доступа, а рабочие данные
у нас есть несколько кейсов, когда их нужно отфильтровать в реальном времени и отправить в другой сервис, который разошлет нотификации клиентам в течение 15 минут

Magistr
30.09.2016
17:22:30
а 15 минут уже интересней, у нас просто отчеты строились

N
30.09.2016
17:23:17
обычно максимальная задержка минут 5

Google

N
30.09.2016
17:23:28
интересно, какая средняя
средняя задержка 3, лол

banuchka
30.09.2016
17:26:08

Magistr
30.09.2016
17:26:28

N
30.09.2016
17:26:36
2 минуты задержки это два рсинка
один с серверов, которые собирают данные, второй с хранилища на обрабатывающий сервер
если б рсинк запускался чаще раза в минуту, то может было бы и получше
а крон не умеет секунды, ахаха
10/10, отлично

Magistr
30.09.2016
17:29:27
хм тебе бы потоковый рсинк
или что-то похожее

N
30.09.2016
17:30:03
да ну что уж там, это не принципиально, и так хорошо

ptchol
30.09.2016
17:30:58

N
30.09.2016
17:31:29
ну можно, но это как-то смешно и стыдно одновременно
надо будет предложить

ptchol
30.09.2016
17:32:19
И по-моему анакрон или какой то другой умеет в секунды

N
30.09.2016
17:32:38
соседний отдел вот это продает:
http://www.ironsrc.com/atom/data-flow-management/
мы тоже пользуемся, но параллельно с нашим процессом
потому что исходные логи тоже надо хранить на всякий случай