yopp
с этого надо начинать всегда
Alexey
а jombo чанк уже никуда не поедет? он не балансируется?
Alexey
в чем как бы проблема jombo чанка?
yopp
нет, не поедет
yopp
во всём
Alexey
понятно. то есть их не должно быть...
yopp
да, потому что они всю идею шардинга на нет сводят
Alexey
то есть с идеальном случае над такое дополнительное поле, которое возрастает, но не сильно
Alexey
то есть чтоб за период возрастания отделился чанк и мог отбалансироваться
yopp
не бывает идеального поля для всех
yopp
я же тебе говорю: надо исходить из того что ты с данными потом будешь делать
Alexey
они будут храниться годами и выгружаться за последние несколько дней, что потом в какой-нибудь кликхаус попасть
yopp
вот например как выглядит неравномерное распредление чанков при записи. сначала всё шло хорошо (слева ровно) и данные равномерно попадали на разные шарды. а потом вылезло говно, которое называется «алгоритм балансировки» и из-за того что балансировщик тупой, данные начали попадать чаще на одни шарды, чем на другие https://yopp.in/13lg
yopp
и вот так вот просела производительность кластера на вставку https://yopp.in/13mZ
yopp
на графике сети пики это примерно 300мбит/с
yopp
кстати, можно иначе посмотреть
Alexey
а у меня на каждый инсерт еще четыре апдейта приходит
Alexey
а какой у тебя iowait на такую запись?
yopp
во, наглядно: https://yopp.in/13nq
yopp
yopp
но я уверен что оно там конечно в сторадж упирается, потому что там на части серверов специально примонтирован медленны сетевой сторадж
𐰕𐰄𐰍𐰭𐰄𐰲
https://www.youtube.com/watch?v=0vPt7GI-2kc&feature=share
yopp
CPU: 48% usr 4% sys 0% nic 46% idle 0% io 0% irq 0% sirq
yopp
yopp
оно стоит просто ПИЗДЕЦ
Alexey
0 - io странно как-то стало быть, там памяти вагон?
yopp
Mem: 14579448K used, 458084K free, 1444K shrd, 193688K buff, 5627696K cached
yopp
ваще за деньги которые они берут вместе с амазоном за атлас, они могли нанять леди гагу
yopp
натурально
yopp
я когда счёт за две недели увидел, у меня челюсть упала
yopp
это при условии что там относительно не много данных в сутки
yopp
они мне потом издевательское сообщение прислали: А ЧОЙТЫ ВЫ УШЛИ
𐰕𐰄𐰍𐰭𐰄𐰲
А сколько стоит услуги?
yopp
https://www.mongodb.com/cloud/atlas/pricing
yopp
там есть наёбка, очень обидная
yopp
(называется Amazon AWS)
yopp
https://yopp.in/13os
Alexey
Mem: 14579448K used, 458084K free, 1444K shrd, 193688K buff, 5627696K cached
это все рейд или хранилка какая-то модная?
yopp
это все рейд или хранилка какая-то модная?
это виртуализация от ovh. это тестовый стол
yopp
рейд в монге не нужен
yopp
«сдохла нода, ну и хуй с ней, щас новую воткнём»
yopp
а если и нужен, исключительно чтоб iops дожать
yopp
короче атлас может быть в Калифорнии и нормально, с их зарплатами в 300к/год, но в остльном мире — это эребор
𐰕𐰄𐰍𐰭𐰄𐰲
мдаа уж
yopp
не, ну серьёзно, ведро на хецнере с 1Tb nmve стоит 170 евро в месяц
yopp
256гб рам
yopp
510 евро на репликасет
yopp
70 центов в час. у монги за такие деньги 8gb ram / 40Gb storage
Sergey
«сдохла нода, ну и хуй с ней, щас новую воткнём»
главное чтобы ещё пара не сдохла, пока эта заменяется)
Sergey
ну с рейдом всё-таик дисков в 2 раза больше
Alexey
кстати вопрос вот по бекапу. если делать реплику с отложенной записью на каждый шард например, ну или снапшоты. Например, для восстановления данных с этих отложенных серверов. Какова правильная стратегия? собирается еще один шаред кластер из этих серваков и бекапом конфиг-серверов?
yopp
правильная стратеги с бекапами, исходить из того, сколько и на какие данные ты готов потратить денег
yopp
и сколько будет стоит минута простоя если эти данные не будут доступны
yopp
и что будет если они безвовратно будут утеряны
Alexey
ну как всегда)) денег нет, но вы держитесь
yopp
увольте CTO
yopp
и его зарплату пустите на бекапы
yopp
потому что если у вас нет денег на бекапы, значит вам данные не нужны :)
yopp
тогда зачем бекапы!
Alexey
да хоть 200 ;) тем не менее. Какое правильное восстановление в этом случе
yopp
яж говорю
yopp
и вот это всё
yopp
нет правильный стратегии
yopp
есть выгодная стратегия
Slava
не, ну серьёзно, ведро на хецнере с 1Tb nmve стоит 170 евро в месяц
а я правильно понял это вот оно ? https://www.hetzner.de/en/hosting/produkte_rootserver/px61nvme
yopp
https://www.hetzner.de/en/hosting/produkte_rootserver/px121ssd + 2x 512Gb NMVE (42€) + Flexipack
yopp
ssd тоже можно заюзать
yopp
и да, если не ЕС, то без VAT https://www.hetzner.de/ot/hosting/produkte_rootserver/px121ssd
Alexey
скажем, для наиболее быстрого восстановленя в случае отложенной записи - это сборка второго шаред кластер из этих отложенных реплик?
yopp
надо сначала определится с моделью угроз
Alexey
удаление коллекции
yopp
тогда да, отложенная реплика
yopp
а вообще права нужно оторбать на drop у всех
yopp
и вообще, приучится к DENY ALL, ALLOW NONE и выдачей роли конкретного права на конкретную коллекцию
Alexey
это я понял. а восстанволение через сборку второго шаред кластера же? правильно ли я понимаю, что для этого надо к этим репликам поставить пару, иначе они будут только ридонли
Alexey
то есть фактически восстановление шаред кластера - это дублирование отложенной реплики и сборка второго кластер, чтоб восстановить коллеццию?
Alexey
и по ключу шардирования все-таки. Правильно ли я понимаю, если совсем просто: date или _id - запись идет все время на один шард из-за монотонно возрастающего ключа client_id - запись на все шарды