@mongodb_ru - страница 211 - Telegram web archive

Max

как я понимаю, вам нужен полный дамп с текущего засинхронизированного хоста, вместе с оплогом. Вливайте его в новую базу и вставляйте в репликасет - должен подхватиться и начать досинкиваться. Выше правильно отметили про размер оплога Вкратце я бы смотрел как: на рабочем репликасете запустите rs.printSlaveReplicationInfo() интересует строка log length start to end: - это будет ориентировочное время, за какой период у вас лежат данные в оплоге. Вот за это время надо успеть сделать дамп, влить его на новый хост, который планируете добавить в репликасет, и подключить его. Если успеете , то новый хост найдет нужные данные для досинкивания. проверять состояние можно через rs.printSlaveReplicationInfo() — будет видно время отставания. Вообще же я сомневаюсь, что дамп базы + restore ее на новом хосте будет ощутимо быстрее, чем синк данных в изначально пустую базу. Рассмотрите вариант синка с нуля, но опять же - прикиньте размер оплога, чтобы изначальный синк (там еще будет построение индексов, если мне не изменяет память) успел пройти за то время, на которое хватает оплога.

SvPupok

а вообще остановить запиь в базу, на время создания слейва, вы не имеете возможности?

Oleg

Нет) увы)

Oleg

Спасибо за разьяснения

Sasha

Господа, добрый день, Кому-то известно insert vs insert_many с точки зрения используемых файловых дескрипторов имеют отличия? Заранее благодарен за ответ.)

Nick

А при чем тут дескпторы? Если подразумеваются коннекты, то сколько откроете столько и будет использовано

Sasha

Подразумевается операция записи на жесткий диск

Nick

На диске коллекция выглядит как один файл плюс файлы индексов, так что об этом не стоит беспокоиться

Nick

Вообще с чего аозникла необходимость в контроле дескрипторов?

Sasha

В связи с большим кол-вом используемых дескрипторов на запись

Sasha

Вопрос не о контроле, а в том, каким образом можно реализовать отложенную запись таким образом, чтобы открывался файл и записывался некоторый набор данных за одну сессию. По всей видимости insertMany по умолчанию делает не так.

Nick

Эм, wt достаточно умен чтобы самостоятельно решить когда именно произвести запись, не пытайтесь оптимизировать, это работа движка бд

Sasha

К сожалению есть просто факт, IOPS очень большой и это проблема.

Nick

По умолчанию все буферится и скидывается на диск периодически. Вы модете только принадительно вкючить журналировагие каждого инсерта, но видимо вам это не требуется

Nick

Сколько вставок в базу идет?

yopp

Вопрос не о контроле, а в том, каким образом можно реализовать отложенную запись таким образом, чтобы открывался файл и записывался некоторый набор данных за одну сессию. По всей видимости insertMany по умолчанию делает не так.

Никак.

Sasha

Спасибо

yopp

К сожалению есть просто факт, IOPS очень большой и это проблема.

Дескриптор никак не относится к количеству IOPS, это просто пайп

yopp

Ваша проблема не в количестве открытых дескрипторов, а в том, что объём чтения или записи превышает возможности железа. Лучшая стратегия разобраться какие запросы создают такую нагрузку.

yopp

И дальше принять решение что вам будет выгоднее: вертикально или горизонтально масштабировать субд или рефакторить приложение и менять схему

Sasha

Спасибо, тогда вот вопрос, при insertMany у нас происходит последовательный доступ к диск?

yopp

Спасибо, тогда вот вопрос, при insertMany у нас происходит последовательный доступ к диск?

Вы вообще никак не можете контролировать порядок доступа к данным на диске.

Sasha

Меня интересует как это реализовано в mongodb

yopp

Нет никакого способа это спрогнозировать.

yopp

Может и да, может и нет

yopp

insertMany это просто сгруппированные в один сетевой пакет множества insert

Sasha

Да, спасибо.

yopp

Насколько большой у вас поток данных в субд?

Nickolay

Спасибо, тогда вот вопрос, при insertMany у нас происходит последовательный доступ к диск?

https://github.com/mongodb/mongo/blob/a77297dbe34d5cd838a4da55e9d83dc70c510bba/src/mongo/db/catalog/collection_impl.cpp#L452 судя по этому коду доступ последовательный

Sasha

файловая система ext3-4 не гарантирует последовательный доступ

yopp

https://github.com/mongodb/mongo/blob/a77297dbe34d5cd838a4da55e9d83dc70c510bba/src/mongo/db/catalog/collection_impl.cpp#L452 судя по этому коду доступ последовательный

Нет, вы не правы. Весь код сводится к recordStore->insertRecords Это высокоуровневый API для подключаемых record stores. Реальное поведение будет зависеть от используемого. С 3.2 это WiredTiger, который использует copy-on-write. Предсказать какая нагрузка будет в случае вставки ряда документов — невозможно. Это будет зависеть от ряда факторов: сколько reusable pages есть, хватает ли их для вмещения данных, в каких областях дискового хранилища они находятся

Sasha

спасибо

yopp

Второй момент: даже если приложение чего-то хочет от ФС последовательно, это не значит что с диска это будет прочитано последовательно.

yopp

Как на самом деле данные будут прочитаны с диска тоже крайне сложно предсказать.

yopp

Всё это носит вероятностный характер.

Nickolay

Нет, вы не правы. Весь код сводится к recordStore->insertRecords Это высокоуровневый API для подключаемых record stores. Реальное поведение будет зависеть от используемого. С 3.2 это WiredTiger, который использует copy-on-write. Предсказать какая нагрузка будет в случае вставки ряда документов — невозможно. Это будет зависеть от ряда факторов: сколько reusable pages есть, хватает ли их для вмещения данных, в каких областях дискового хранилища они находятся

Не спорю, код mongodb смотрю второй или третий раз в жизни, но вижу, что WiredTigerRecordStore::_insertRecords так же последовательно пишет данные, по одной записи. Насчет файловых систем безусловно всё так, рассуждаю исключительно с точки зрения того, как это описано в коде и не более

yopp

Не спорю, код mongodb смотрю второй или третий раз в жизни, но вижу, что WiredTigerRecordStore::_insertRecords так же последовательно пишет данные, по одной записи. Насчет файловых систем безусловно всё так, рассуждаю исключительно с точки зрения того, как это описано в коде и не более

Вы опять делаете неверное предположение, основываясь на обрывочной информации. Указанный вами класс это реализация интерфейса record store. Тот факт что там последовательно вызываеются методы setkey setvalue самого WiredTiger ещё не означает что операции на деле будут выполнятся последовательно.

yopp

Если вы хотите разобраться в этом вопросе, почитайте документацию к WiredTiger или статьи о его архитектуре. Они в интернете есть.

yopp

Есть даже несколько сравнений WT с другими KV хранилищами.

Nickolay

Вы опять делаете неверное предположение, основываясь на обрывочной информации. Указанный вами класс это реализация интерфейса record store. Тот факт что там последовательно вызываеются методы setkey setvalue самого WiredTiger ещё не означает что операции на деле будут выполнятся последовательно.

ага, понятно. То есть операции записи где-то внизу (имею ввиду в коде) асинхронные?

Nickolay

Если вы хотите разобраться в этом вопросе, почитайте документацию к WiredTiger или статьи о его архитектуре. Они в интернете есть.

да, хорошо, спасибо!

yopp

ага, понятно. То есть операции записи где-то внизу (имею ввиду в коде) асинхронные?

Нет, асинхронность и последовательный доступ к диску это разные вещи. Представьте себе WT как обычный GC на счетчике указателей. Грубо говоря WT оперирует ссылками на страницы. Он никогда не меняет содержимое существующей страницы, а только создаёт новую и заменяет указатель. Когда на страницу нет больше указателей, страница помечается как свободная. Свободные страницы могут использоваться как новые. Исходя из этого даже последовательное изменение данных не гарантирует последовательного положения страниц в дисковом хранилище.

yopp

Stable: 3.6.3 (Feb 23, 2018), Bugfix: 3.4.13 (Feb 10, 2018) 3.6.3: https://docs.mongodb.com/manual/release-notes/3.6/#february-23-2018 3.4.13: https://docs.mongodb.com/manual/release-notes/3.4/#feb-10-2018 3.2.19: https://docs.mongodb.com/manual/release-notes/3.2/#feb-6-2018 (End of life: September 2018) 3.0.x: Support ended February 2018

Александр 🌲🙏🏽

Друзья, помните я когда-то спрашивал о своей структуре данных и о том, как ее обновлять: https://stackoverflow.com/questions/48967418/multiple-arrays-of-objects-inside-array-of-objects-in-mongodb Дак вот в 3.6 то, оказывается, эти фичи допилили как раз: http://thecodebarbarian.com/a-nodejs-perspective-on-mongodb-36-array-filters.html и это нормально считается когда в документах есть массив с объектами, в которых тоже есть массивы.

Alchemist

@websanya это касается только nodejs, оптимизаций не подвезли, связанных с такими массивами?

Alchemist

Что можно быстро поднять в докере, чтобы попрофилировать монгу, знает кто нибудь?

Александр 🌲🙏🏽

@websanya это касается только nodejs, оптимизаций не подвезли, связанных с такими массивами?

Не, это в самом ядре добавили.

Alchemist

В смысле если я на джавке сижу, я почувствую разницу то?

Александр 🌲🙏🏽

Дык тут разница в том, что принципиально не было этого функционал.

Александр 🌲🙏🏽

$[]

Александр 🌲🙏🏽

ArrayFilters.

Александр 🌲🙏🏽

Фильтры к сожалению индексы не используют, поэтому это полудохлая фича, но тем не менее.

Александр 🌲🙏🏽

И теперь можно несколько $[] использовать за раз.

Александр 🌲🙏🏽

Это добавлено в ядро, поэтому все дравйвера тоже теперь это будут использовать с 3.6

𝕊𝕒𝕚𝕟𝕥𝔻𝕖𝕧𝕚𝕝

Здравствуйте. Использую http метод GET базы. Что нужно вводить в "query"?

Nick

странный вопрос, вы с помощью чего к монге цепляетесь?

𝕊𝕒𝕚𝕟𝕥𝔻𝕖𝕧𝕚𝕝

странный вопрос, вы с помощью чего к монге цепляетесь?

Да через один конструктор телеграм бота делаю

𝕊𝕒𝕚𝕟𝕥𝔻𝕖𝕧𝕚𝕝

UpdateDB: {"collection":"cryptobot","query":[[{"username":"${global.message.from.username}","messages":[{"time":"${global.message.date}","text":"${global.message.text}"}]}]],"upsert":true} ReadDB: {"collection":"cryptobot"} SendMessage: "${data}" Почему-то по команде отправляет пустую базу

Nick

для начала назовите конструкто/язык/драйвер

𝕊𝕒𝕚𝕟𝕥𝔻𝕖𝕧𝕚𝕝

для начала назовите конструкто/язык/драйвер

www.mega-bot.com

Nick

там регаться надо, видимо там же спрашивайте у саппорта почему не работает

𝕊𝕒𝕚𝕟𝕥𝔻𝕖𝕧𝕚𝕝

он на работе...

Nick

диалог не получается)))

Anonymous

Здравствуйте. Подскажите пожалуйста, у меня есть коллекция 'Settings', в которой находится объект 'table'. Как я могу добавлять новые поля не в саму коллекцию, а именно в объект?! Заранее спасибо

Nick

Через точку, как и в обычном js

Nick

table.v1

Nick

И дальше вставка объекта в коллекцию, лиьо через апдейпт

𝕊𝕒𝕚𝕟𝕥𝔻𝕖𝕧𝕚𝕝

Здравствуйте. Установил монгодб на комп. что ту длаьше делать?

Oleg

Здравствуйте. Установил монгодб на комп. что ту длаьше делать?

использовать

𝕊𝕒𝕚𝕟𝕥𝔻𝕖𝕧𝕚𝕝

Знать бы, как... Создало папку, там файлы какие-то

Oleg

Знать бы, как... Создало папку, там файлы какие-то

https://docs.mongodb.com/

Anonymous

Не подскажете, можно ли сделать примерно следующее: Поставить кластер из 3-ех арбитров за ~keepalived и подключить это к 2-ум нодам как арбитр? Т.е. я хочу реплику с арбитром, но так, чтобы 2 ноды думали что общаются с одним арбитром, хотя на самом деле общаются с балансером, за которым стоит кластер арбитров Даже не спрашивайте зачем

Anonymous

балансер раздает на живого арбитра с самым высоким приоритетом, а не round-robin-ом нужно для того, чтобы нода не уходила в секондари, когда отваливается арбитр + праймари

Anonymous

т.е. схема, которую я хочу сделать выглядит так: 2 дц, на каждом стоит нода + арбитр, + арбитр на виртуалке где-нибудь + балансер на железобетонной инфраструктуре, за которым стоят все 3 арбитра. воткнуть арбитр на железобетоне, увы, нельзя

Anonymous

таким образом, если останется в живых только один из дц + балансер, нода сможет выиграть голосование и стать кандидатом от реплики

yopp

Не подскажете, можно ли сделать примерно следующее: Поставить кластер из 3-ех арбитров за ~keepalived и подключить это к 2-ум нодам как арбитр? Т.е. я хочу реплику с арбитром, но так, чтобы 2 ноды думали что общаются с одним арбитром, хотя на самом деле общаются с балансером, за которым стоит кластер арбитров Даже не спрашивайте зачем

Ставить любые сервисы монги за какое-то ПО — плохая идея.

yopp

Если я правильно понимаю вашу проблему, вам хватит в том дц, который «приоритетнее» создать перекос в числе голосующих нод.

yopp

Главное чтоб при падении линка между дц, в одном из дц образовалось голосующее большинство

yopp

В остальном: в протокол уже всё встроено, включая инструменты для «балансировки» (readPreference), использование внешних инструментов может привести к непредсказуемым и фатальным результатам.

Slava

Расскажи что получилось потом

Попробовал я тут эту странную штуку: wt в lsm режиме, таки да создать коллекцию просто db.createCollection( "test_lsm", { storageEngine: { wiredTiger: { configString: "type=lsm" } } } ) постестил скорость вставки, пока могу сказать что она отличается, так как я делал тест на коленке и не уверен в его мега достоверности, надо скорее всего нормально бенчмаркать