
ptchol
17.05.2016
10:39:15
вы просто неосили, мы все знаем )
у вас там деньги зарабатывать вот это все.
вам некогда изучать. путь ХХП )

Daniel
17.05.2016
10:39:32
все-все-все

Google

James
17.05.2016
10:39:34
пля как посмотреть?
движок

Daniel
17.05.2016
10:39:38
у меня дежавю

James
17.05.2016
10:39:48
в конфиге нету энгина

Daniel
17.05.2016
10:39:59
приходите на hl++ послушать наши доклады, серьезно
там и решите, неосилили мы, или просто умнее многих

James
17.05.2016
10:40:21
какие нах доклады у меня тут мастер монги падает

Daniel
17.05.2016
10:40:29
а я не вам :)

ptchol
17.05.2016
10:40:33
serverstatus слитно

James
17.05.2016
10:41:14
actr:PRIMARY> db.serverstatus().storageengine
2016-05-17T13:41:12.803+0300 E QUERY TypeError: Property 'serverstatus' of object test is not a function
at (shell):1:4

ptchol
17.05.2016
10:41:25

Daniel
17.05.2016
10:41:46

Google

ptchol
17.05.2016
10:42:26

Daniel
17.05.2016
10:42:28
на прошлом hl++ я рассказывал про фс. чего я там не осислил-=то?

ptchol
17.05.2016
10:42:46
Хм. сорян я попутал наверно

James
17.05.2016
10:42:52
понял ща

ptchol
17.05.2016
10:42:54
а про мускули и РТБ не вы ? )

Daniel
17.05.2016
10:43:07
а на hl я про rtb рассказывал, осенью
да, я

ptchol
17.05.2016
10:43:16
во )

Daniel
17.05.2016
10:43:24
чего я не осилил там?
обратная связь - это важно

ptchol
17.05.2016
10:44:11
Если вам это действительно важно, я пересмотрю доклад и напишу вам, что мне показалось странным.
чтобы сейчас не быть голословным

Daniel
17.05.2016
10:44:26
не

James
17.05.2016
10:44:46
"storageEngine" : {
"name" : "mmapv1"
всё такие он не в кеш уходит

ptchol
17.05.2016
10:45:02
тоска...

James
17.05.2016
10:45:18
а в кешированую память
так точнее будет

ptchol
17.05.2016
10:45:31
это норм.

Daniel
17.05.2016
10:45:32
что там все странное в том проекте было - я в курсе, у меня тогда были трудные времена. я про то, где я тему недостаточно глубоко вспахал. мне действитеьно важно - нам тут с коллегой три доклада на двоих предстоят через пару недель

Google

ptchol
17.05.2016
10:45:37
sysctl -a | grep swapp

James
17.05.2016
10:45:58
vm.swappiness = 60

ptchol
17.05.2016
10:46:47
free -g

James
17.05.2016
10:47:40
free -g
total used free shared buffers cached
Mem: 62 62 0 0 0 60
-/+ buffers/cache: 2 60
Swap: 31 0 31

ptchol
17.05.2016
10:48:11
ну оно наверняка у вас уползает в своп

James
17.05.2016
10:48:30
в графиках своп пустой почти

ptchol
17.05.2016
10:48:30
вырубите своп, либо для начала своппиннес в 0 выставите

James
17.05.2016
10:48:58
хм

ptchol
17.05.2016
10:49:07
там пара сотен мегабайт гоняющихся по нему при забитой памяти могут привести к проблемам.

James
17.05.2016
10:49:17
как назначить?

ptchol
17.05.2016
10:49:32
во вторых. на реплике выставите stoage engine wired tiger

James
17.05.2016
10:49:32
vm.swappiness
мож откл свопа поможет

ptchol
17.05.2016
10:49:49
компрессию соавьте стандартную.
у нас на самых плохих кейсах комперссия составляла 2.2 где то.
но нужно чтобы у вас был свободный cpu компрессия даст примерно процентов 15 сверху к той нагрузке что была.
в рабочее время, а не во время восстановления.
и посмотрите размер вашего лога. если репликации идет медленно и данных много, вы можете не успеть

Paul
17.05.2016
11:07:09

Google

James
17.05.2016
11:07:13
в общем кроме смены движка выхода не вижу
оплог?
увеличить лог?

Paul
17.05.2016
11:08:44
да. Скорее всего разрыв репликации из-за того, что данные не успевают влится в slave

ptchol
17.05.2016
11:08:53
там есть командочки

Paul
17.05.2016
11:08:56
у меня такое было, помогло увеличение полога на мастере в 16 раз

ptchol
17.05.2016
11:09:02
rs.printreplicationinfo()

Paul
17.05.2016
11:09:02
оплог не меняется "на ходу"

Admin
ERROR: S client not available

James
17.05.2016
11:09:06
дайтека командочки

Paul
17.05.2016
11:09:10
rs.status()

James
17.05.2016
11:09:12
или ткните что сделать
сек

ptchol
17.05.2016
11:09:42
и она помоему показывает то, за какой период крайние данные в пологе

Paul
17.05.2016
11:09:44
https://docs.mongodb.com/manual/core/replica-set-oplog/

ptchol
17.05.2016
11:09:46
*оплоге

Paul
17.05.2016
11:10:11
да там вообще лучше весь раздел проштудировать, он совсем небольшой

ptchol
17.05.2016
11:10:16
если вы за период с указанного там времени до текущего, не успеете репликацию сделать - все плохо )


James
17.05.2016
11:10:48
connecting to: test
actr:PRIMARY> rs.status()
{
"set" : "actr",
"date" : ISODate("2016-05-17T11:09:36.308Z"),
"myState" : 1,
"members" : [
{
"_id" : 0,
"name" : "ып:27017",
"health" : 1,
"state" : 1,
"stateStr" : "PRIMARY",
"uptime" : 3138,
"optime" : Timestamp(1463483376, 14),
"optimeDate" : ISODate("2016-05-17T11:09:36Z"),
"electionTime" : Timestamp(1463480278, 1),
"electionDate" : ISODate("2016-05-17T10:17:58Z"),
"configVersion" : 47573,
"self" : true
},
{
"_id" : 1,
"name" : "ып:27017",
"health" : 1,
"state" : 5,
"stateStr" : "STARTUP2",
"uptime" : 2993,
"optime" : Timestamp(0, 0),
"optimeDate" : ISODate("1970-01-01T00:00:00Z"),
"lastHeartbeat" : ISODate("2016-05-17T11:09:34.344Z"),
"lastHeartbeatRecv" : ISODate("2016-05-17T11:09:34.924Z"),
"pingMs" : 2,
"syncingTo" : "ып:27017",
"configVersion" : 47573
},
{
"_id" : 2,
"name" : "ып:27017",
"health" : 1,
"state" : 7,
"stateStr" : "ARBITER",
"uptime" : 3099,
"lastHeartbeat" : ISODate("2016-05-17T11:09:34.875Z"),
"lastHeartbeatRecv" : ISODate("2016-05-17T11:09:34.907Z"),
"pingMs" : 0,
"configVersion" : 47573
}
],
"ok" : 1
}


Paul
17.05.2016
11:10:51
ну почему плохо? Нормально, оплог подкрутить и все станет хорошо

Google

ptchol
17.05.2016
11:10:52
здесь просто татус

Paul
17.05.2016
11:11:10
на данном снимке ып2 еще синхронизируется, тут только ждать


Daniel
17.05.2016
11:11:16
connecting to: test
actr:PRIMARY> rs.status()
{
"set" : "actr",
"date" : ISODate("2016-05-17T11:09:36.308Z"),
"myState" : 1,
"members" : [
{
"_id" : 0,
"name" : "ып:27017",
"health" : 1,
"state" : 1,
"stateStr" : "PRIMARY",
"uptime" : 3138,
"optime" : Timestamp(1463483376, 14),
"optimeDate" : ISODate("2016-05-17T11:09:36Z"),
"electionTime" : Timestamp(1463480278, 1),
"electionDate" : ISODate("2016-05-17T10:17:58Z"),
"configVersion" : 47573,
"self" : true
},
{
"_id" : 1,
"name" : "ып:27017",
"health" : 1,
"state" : 5,
"stateStr" : "STARTUP2",
"uptime" : 2993,
"optime" : Timestamp(0, 0),
"optimeDate" : ISODate("1970-01-01T00:00:00Z"),
"lastHeartbeat" : ISODate("2016-05-17T11:09:34.344Z"),
"lastHeartbeatRecv" : ISODate("2016-05-17T11:09:34.924Z"),
"pingMs" : 2,
"syncingTo" : "ып:27017",
"configVersion" : 47573
},
{
"_id" : 2,
"name" : "ып:27017",
"health" : 1,
"state" : 7,
"stateStr" : "ARBITER",
"uptime" : 3099,
"lastHeartbeat" : ISODate("2016-05-17T11:09:34.875Z"),
"lastHeartbeatRecv" : ISODate("2016-05-17T11:09:34.907Z"),
"pingMs" : 0,
"configVersion" : 47573
}
],
"ok" : 1
}
https://gist.github.com/, извините


ptchol
17.05.2016
11:11:52
да не нада ждать
нужно в репликейшен инфо глянуть
и понять

James
17.05.2016
11:12:04
я то и жду но сервак не выдерживает
PID USER PRI NI VIRT RES SHR S CPU% MEM% TIME+ Command
15644 mongodb 20 0 1.6T 40.9G 40.8G S 5.2 65.3 1:50.59 /usr/bin/mongod —config /etc/mongodb.conf

Paul
17.05.2016
11:12:47
давайте уточним - что значит "не выдерживает"? реплика падает в карантин?

James
17.05.2016
11:12:49
это хтоп

Paul
17.05.2016
11:12:56
ну и что? OOM срабатывает?

James
17.05.2016
11:12:58
65.3 сейчас
мастер падает
просто процесс отваливается

Paul
17.05.2016
11:13:24
на время репликации рекомендуется просто остановить остальные сервисы на серваке. Пусть монго резвится в гордом одиночестве.
как именно падает?
в логах что?

James
17.05.2016
11:13:29
когда становится память 100%
с+ выхлоп
могу скинуть

Paul
17.05.2016
11:14:37
освободить мастер можно?