
[Anonymous]
30.07.2016
22:31:50
В данный момент всё быстро работает.
Я могу, конечно, скинуть текущий.
Но я думаю, тебе интереснее посмотреть в момент, когда база проседает.

yopp
30.07.2016
22:38:48
кинь сейчас

Google

yopp
30.07.2016
22:39:07
сравним потом

Vasiliy
03.08.2016
14:58:31
Добрый день, не могу нагуглить чтение из mongodb по частям. Пытаюсь читать из-под python коллекцию, в которой 700к больших документов, простым db.coll.find(), и не хватает RAM для выполнения операции. Не подскажете, как с этим разобраться или в какую сторону гуглить?

yopp
03.08.2016
15:00:32
курсоры

Sergey
03.08.2016
15:05:24
for somevar in db.coll.find():
...

Vasiliy
03.08.2016
15:07:18
а вызов db.coll.find() не равносилен обычному чтению коллекции целиком?

Sergey
03.08.2016
15:07:24
нет, это курсор
во всяком случае в pymongo 3.x
с более старыми я не работал

Vasiliy
03.08.2016
15:08:53
спасибо за помощь!
попробую с курсором
Добрый день, не подскажете, какой лучше читать мануал, чтобы начать работать с mongodb + apache spark? И, может быть, подскажете, на чём удобнее будет работать scala или python?

Gregory
05.08.2016
09:43:32
There are a few APIs that are either different or not available in Python.
Но я, если что, просто мимо проходил и не трогал спарк.
Так интересовался

Google

Vasiliy
05.08.2016
09:45:30
да, тоже про python такое слышал

Aleksandr
08.08.2016
07:43:33
ух, набижали

Alexey
08.08.2016
07:44:17
Из постгри.

Alex
08.08.2016
07:44:18
Конечно, щас еще будем обьяснять чем постгрес лучше монги :)

Aleksandr
08.08.2016
07:51:59
https://habrahabr.ru/post/306810/
опять хакеры говна в жопу заливают

yopp
08.08.2016
07:54:47
https://yopp.in/Vkc :(
вот так выглядит апгрейд mongos с 3.0 на 3.2
было 4k qps, стало 1.7k :|
и в логах каждые пару сотен мс: «[LockPinger] handled late remove of old distributed lock with ts …»

Sergey
08.08.2016
07:57:11
А гугл что говорит?

yopp
08.08.2016
07:57:43
https://jira.mongodb.org/browse/SERVER-9262

Sergey
08.08.2016
07:59:06
Это я видел, но ему 3 года

yopp
08.08.2016
07:59:45
а это всё
ещё ссылка на сырцы :)

Sergey
08.08.2016
08:00:58
Обновился только mongos илм все вообще?

yopp
08.08.2016
08:01:01
// Either the update went through or it didn't, either way we're done trying to
// unlock
log( DistributedLock::logLvl - 1 ) << "handled late remove of old distributed lock with ts " << *i << endl;
removed = true;

Roman
08.08.2016
08:01:02

yopp
08.08.2016
08:01:28
хм

Google

yopp
08.08.2016
08:06:17
коннекшенов чота 4к стало внезапно: https://yopp.in/Vm6

Sergey
09.08.2016
10:03:55
Есть уже где-то список фич 3.4? Релиз в ноябре, еслм верить их JIRA. Пока нашёл только
Release Notes - MongoDB
https://jira.mongodb.org/secure/ReleaseNote.jspa?projectId=10380&version=17091
Наконец-то обещают case insensitive indexes

Vasiliy
09.08.2016
14:16:55
добрый день, хочу удалить дубликаты из коллекции. Нашёл метод db.collection.ensureIndex({my_key:1}, {unique: true, dropDups: true})
нашёл даже примеры, где на коллекцию с дубликатами применяют этот метод и всё работает как надо - дубликаты удаляются.
Однако, когда я запускаю у себя этот метод, сообщается об ошибке ""errmsg" : "E11000 duplicate key error collection:" ну и указывается на первое встречающееся значение my_key, которое встречается в коллекции больше одного раза.
не подскажете, в чём я ошибаюсь?

mardybm
09.08.2016
14:21:24
я думаю сначала нужно удалить дубликаты, а потом уже цеплять индекс
как вариант можно создать вторую пустую коллекцию с этим индексом и перелить в нее документы из первой коллекции

Vasiliy
09.08.2016
14:24:03
)) небанально, но сработает
почему-то не могу найти другого метода быстрого удаления дубликатов, кроме объявления индексов, мне в основном это кажется странным
в любом случае, спасибо за совет!

[Anonymous]
09.08.2016
21:25:26
dropDups не работает уже давно.
Just in case.

Vasiliy
10.08.2016
07:41:24
да, заметил потом, спасибо
вообще довольно распространённая, как мне кажется, задача, удалить документы из коллекции, в которых дублируется определённое поле. Теперь я понял, что нужно было заранее предусматривать такое и устанавливать индексы, которые бы не позволяли записывать подобные документы, но почему сложно найти простой механизм удаления дубликатов, я пока не уяснил.


Serge
10.08.2016
12:24:49
да, заметил потом, спасибо
вообще довольно распространённая, как мне кажется, задача, удалить документы из коллекции, в которых дублируется определённое поле. Теперь я понял, что нужно было заранее предусматривать такое и устанавливать индексы, которые бы не позволяли записывать подобные документы, но почему сложно найти простой механизм удаления дубликатов, я пока не уяснил.
допустим есть три документа с одним и тем же значением "foo" и разными значениями "bar".
ты можешь сформулировать универсальное правило какой из них надо оставить,а какие удалить?
а в пределе к минимуму это не "bar", а "_id". кто знает что завязано где-то еще за этот "_id"?

Vasiliy
10.08.2016
12:29:48
я согласен, что моя постановка вопроса, быть может, некорректна, и задача решается на этапе проектирования коллекций. Мне скорее просто важно оставить в коллекции любой из документов с повторяющимися bar. И, на мой взгляд, не совсем корректно сводить пример к _id, так как это ключ по умолчанию.

Max
10.08.2016
12:53:24
Привет, почему монга со временем сжирает 99% памяти? Каждый день приходится перезапускать
Монгодб килится
Куда смотреть?

[Anonymous]
10.08.2016
12:53:44
Я вот тоже каждый день перезапускаю, но не из-за памяти.

Google

yopp
10.08.2016
12:54:07
эм

Max
10.08.2016
12:54:16
В доке написано, что оно хавает 65% от оперативки - 1гб или 1гб смотря что больше
У меня 2гб
Оперы всего

[Anonymous]
10.08.2016
12:54:29
А кто убивает процесс-то?

Max
10.08.2016
12:54:30
Оно стабильно сжирает 95%

[Anonymous]
10.08.2016
12:54:34
Ты уверен?

yopp
10.08.2016
12:55:56

Max
10.08.2016
12:55:56

yopp
10.08.2016
12:56:09
сама монга ещё может нормально жрать памяти вне WT

Max
10.08.2016
12:56:24

yopp
10.08.2016
12:56:57
ну вот, там в документации написано что никто не гарантирует что монга не сожрёт больше
а она сожрёт

Max
10.08.2016
12:57:26
Но как бы безконтрольно
Аж до процесс киллд

yopp
10.08.2016
12:57:59
killed это ось прихлопнула процесс, так как ядру не хватило памяти
mysql и монга на одном хосте с 2 гигами памяти?
норм

Max
10.08.2016
12:58:23
Ну вот сейчас 84
Да но сиквел почти не юзается

Google

yopp
10.08.2016
12:58:58
включи своп
если не хочешь добавлять памяти

Max
10.08.2016
12:59:38
На сколько гб в этом случае имеет смысл свопа?