Il
RPO?
banuchka
что? ну можно еще учесть, что аппа в процессе работы делает снепшоты в синхронном треде, т.е. совсем плохим io там сделать нельзя, а иначе задача бы сильно упростилась
banuchka
допустим, что устроит 80% от RAID1+0 из 4х 10k SAS
Il
RPO - recovery point objective. Сколько данных готовы потерять в случае отказа оборудования
Magistr
тогда можно вешаться вообще
незнаю у меня счас на проекте сервис состоит из пикселя, веб уи, и 4х рест бекэндов, все это можно пихать в докер если надо проскейлиться, за этим конечно стоит база, но зачем мне базу в докер когда есть RDS
Anonymous
да, но не все задачи решает rds
Anonymous
иногда надо процессить сырые данные, которые приходят в виде файлов, например
Magistr
emr же на спот инстансах
Magistr
прочитал с с3 положил в базу или опять в с3
Anonymous
не очень охота спорить, но у этого тоже есть ограничения
Anonymous
хотя у нас есть продукт для этого, отлично работает, складывает в redshift
Anonymous
но редшифт стоит очень дорого
Magistr
ну да варианты могут быть разными
Anonymous
на нашем трафике emr будет тормозить, поэтому у нас костыли
Magistr
а какого типа трафик ?
Anonymous
вообще есть kinesis, но он тоже дорогой
Anonymous
2.5 терабайта логов в месяц
Magistr
хм у нас было 20Г логов в день
Anonymous
это не логи доступа, а рабочие данные
Anonymous
у нас есть несколько кейсов, когда их нужно отфильтровать в реальном времени и отправить в другой сервис, который разошлет нотификации клиентам в течение 15 минут
Magistr
а 15 минут уже интересней, у нас просто отчеты строились
Anonymous
обычно максимальная задержка минут 5
Anonymous
интересно, какая средняя
Anonymous
средняя задержка 3, лол
banuchka
Magistr
Anonymous
2 минуты задержки это два рсинка
Anonymous
один с серверов, которые собирают данные, второй с хранилища на обрабатывающий сервер
Anonymous
если б рсинк запускался чаще раза в минуту, то может было бы и получше
Anonymous
а крон не умеет секунды, ахаха
Anonymous
10/10, отлично
Magistr
хм тебе бы потоковый рсинк
Magistr
или что-то похожее
Anonymous
да ну что уж там, это не принципиально, и так хорошо
Anonymous
ну можно, но это как-то смешно и стыдно одновременно
Anonymous
надо будет предложить
Denis
И по-моему анакрон или какой то другой умеет в секунды
Anonymous
соседний отдел вот это продает:
Anonymous
http://www.ironsrc.com/atom/data-flow-management/
Anonymous
мы тоже пользуемся, но параллельно с нашим процессом
Anonymous
потому что исходные логи тоже надо хранить на всякий случай
Denis
А не, гоню про ана
yopp
yopp
ну что за
Anonymous
ну для цены напиши им, это же для энтерпрайза штука
Anonymous
работает почти в реалтайме
Anonymous
даже запартнерились с амазоном по этому поводу
yopp
я стараюсь с теми кто ссыть писать цену не работать :)
yopp
но выглядит интересно
yopp
но они на рекламу заточены, а меня больше интересует категоризация и анализ пользователей внутри
Anonymous
в принципе это несложно написать самому, но вряд ли для редшифта, потому что там все довольно непросто
Anonymous
что значит заточены на рекламу? они просто перекладывают данные туда-сюда
Anonymous
анализ это уже твоя часть
yopp
у них же там какие-то дешборды?
yopp
или я чота не так понял
yopp
http://www.ironsrc.com/atom/user-profiling/
yopp
но оно saas, а я не хочу своих пользователей сдавать
Anonymous
не, это другое вообще
Anonymous
другой продукт совершенно
yopp
f
Anonymous
а что ты хочешь делать
yopp
я думал им туда можно события посылать, а они их проанализируют и расскажут мне больше про пользователя
Anonymous
нет, туда можно только посылать события, а они тебе их положат в твою же базу
yopp
хочу из наших данных понять демографию и базовый профиль
Anonymous
так яндекс метрика же для этого
yopp
не, мне нужно hosted решение
yopp
я пидорасам рекламным не буду давать ни байта информации
Anonymous
хаха
Magistr
кхм можем дописать и продать )
Magistr
yopp
yopp
мы то и сами можем дописать, но это долго и дорого
Magistr
хм прикрутить геоип к базе профилей достаточно просто
Magistr
yopp
не географию, а демографию
Magistr
а блин
Anonymous
толку-то от это geoip
yopp
я хочу знать мальчик/девочка, возраст, возможно ещё какие-то социальные параметры
yopp
доход бы знать