Sheridan
Mark ☢️
Mark ☢️
Mark ☢️
Sergei
Sergei
другого выбора нет
Mark ☢️
а что, ничего другого не было? даже платного ?
Sergei
платного? :)))
Mark ☢️
ну кагбы не смешно
Sergei
как бы смешно.
покажите мне коммерческий сторадж на сотни петабайт.
Sheridan
ну кагбы не смешно
Вот да. Три стойки в день падает, то есть железа так много что проценты сбоев вырастают в стойки железа. А софт исключительно опенсорц или свой. Даже я бы задумался...
Sergei
Sergei
падают заметно реже.
Sergei
Mark ☢️
Mark ☢️
чонть такое
Mark ☢️
я хз. не шарю
Sergei
http://alternativeto.net/software/scaleio/
ценник на сотни петабайт будет где-то в космосе и под конкретную задачу придется делать очень много доработок.
это значит либо вендорлок ценой в сотни миллионов долларов (если не миллиарды) и зависимость от другой компании.
Sergei
кроме того, у нас это не только сторадж, это mapreduce.
Mark ☢️
а что использует дропбокс и или амазон ? самопис ?
Mark ☢️
я реально хз
Sheridan
Mark ☢️
Sergei
не знаю, что щас использует дропбокс, на начале его существования он базировался на Amazon S3
Mark ☢️
ну это просто протокол
Sergei
в чате девопс есть чувак, rbtz
Mark ☢️
а хранится то где
Mark ☢️
Mark ☢️
но сам-то амазон как его по дискам раздупляет. чем ?
Mark ☢️
не очевидно. мож они просто заюзали и заадминили
Sheridan
Mark ☢️
хз
Sheridan
Ну как бы цэф в гитхабе вроде, вытащить почтоадреса девелоперов и отобрать амазонские нетрудно
Sheridan
А вообще интересно, да. Займусь послезавтра, если не забуду :/
Mark ☢️
https://secure.backblaze.com/buy.htm
Sergei
это не сторадж
Mark ☢️
безлимит. а где найоб ?
Mark ☢️
@rbtz
Mark ☢️
эээ. чота не меньшенется
Sergei
@SaveTheRbtz
Mark ☢️
блджад
Sergei
пардон (:
Sergei
честно говоря, есть серьезное подозрение, что сеф не отскейлится на 100Пб
Sheridan
Цэф цэфов собрать? :)
Mark ☢️
Mark ☢️
монитор перегрузится ?
Mark ☢️
Mark ☢️
это значица 100000 Терабайт
Sergei
dreamhost пару лет назад имели 3П
Mark ☢️
тоесть 10000 дисков по 10 терабайт
Sergei
я от балды размер сказал, если чо
Mark ☢️
10К нодов это не космически много (наверно)
Sergei
Mark ☢️
ну так а размер осдмапа зависит же от числа нодов
Mark ☢️
он же местоположение обжекта ВЫЧИСЛЯЕТ а не хранит
Mark ☢️
или я протупил ?
Sergei
скажем так, если бы я имел задачу построить кластер под что-то наподобие региона в aws, скорее всего, я бы имел кластера фиксированного среднего размера с асинхронной реплиацией в соседнюю зону отказоустойчивости.
Sergei
объекта - да, вычисляет.
а сам osdmap - хранит и постоянно обновляет.
Mark ☢️
Sergei
Sergei
ой, я имел в виду pgmap.
Mark ☢️
легче не стало
Sergei
насколько я понимаю, каждый osd репортит монам о состоянии pg, которые сейчас на нем живут.
это происходит с определенным интервалом (на моем кластере - ровно каждую секунду), не уверен, что он конфигурируемый. информация о каждой pg, ее статусе, местоположении и т.п. - стекается на мониторы. все мониторы имеют общий paxos-кворум и полностью копируют эту информацию друг между другом.
соответственно, чем больше у нас pg в кластере, тем больше информации в единицу времени приходит на монитор. в определенный момент нам потребуется шардить мониторы. и что-то мне подсказывает, что произойдет это в районе нескольких десятков или сотен тысяч сообщений в секунду (потому что для обработки миллионов сообщений в секунду на одном сервере нужно уже очень сильно возиться).
Sergei
в определенный момент в нашем сторадже, когда мы стали слишком жирными, нам пришлось организовать шардирование аналогов мониторов.
Mark ☢️
А зачем мониторам знать где какая пг ?
Mark ☢️
прост я не очень понял как это всё работает. только часть понял и то не факт что правильно. где б почитать
Sergei
Each map maintains an iterative history of its operating state changes. Ceph Monitors maintain a master copy of the cluster map including the cluster members, state, changes, and the overall health of the Ceph Storage Cluster.