
Daniel
15.05.2016
19:25:04
чтобы что?

ptchol
15.05.2016
19:25:17
если у вас пара лямов документов и 3 ноды с ССД , то как бы наверно да работает
и 2 с половиной индекса

Daniel
15.05.2016
19:25:33
не

Google

Daniel
15.05.2016
19:25:52
тут не количество индексов важно, а количество документов

ptchol
15.05.2016
19:26:00
как фильтр и классифкатор (фасеты там всякие) оно ок. но вот реально работа с индесами и поиск - ну не айс же.

Daniel
15.05.2016
19:26:04
как раз на паре лямов обновление встает колом
и надо открывать новый индекс

ptchol
15.05.2016
19:26:43
а еще принципиальное отсутсвие шедулинга в кааком либо виде внутри
нет возможности даже бегущие квери убить

Daniel
15.05.2016
19:27:07
раз впилили update on request - значит и шедулинг появился
но - это же все про другое

ptchol
15.05.2016
19:27:29
я про то что доступно пользователю конечному
а еще их позиция "филдсет ин мемори чтобы хоть как то работало" это вобще для каких людей ?

Daniel
15.05.2016
19:28:55
для богатых
не
я довольно агрессивно выступил

Google

Daniel
15.05.2016
19:29:25
на самом деле - я хорошо знаю, что ES говно

ptchol
15.05.2016
19:29:32
я знаю одних людей у которых ЕС хорошо пашет. но у них ноды со 128гб и фьюжн ио в дисках.
и то сука течет и память в ОЛДе засирается в результате ГЦ постоянно коллектит мусор и рестратить приходится.

Daniel
15.05.2016
19:33:35
но кейс “поисковик на ноде и es” - это не про ноду
пробллема-то не в этом всем
это все норм
текущую память можно фиксить
у него родовая травма есть

ptchol
15.05.2016
19:34:41
серьезно ?) а мы не знаааааали )

Daniel
15.05.2016
19:34:43
он, сцуко, все время компактит свои листья
и нагрузку на диски минимум удваивает
а в нормальной ситуации - утраивает
и вот это уже не победить

ptchol
15.05.2016
19:36:20
если вам не нужно тут же уметь искать данные после получения, можно просто реже флашить на диск их
я к тому что компенсировать можно.
просто есть мнение что ЕС удобен для аналитки

Daniel
15.05.2016
19:37:33
мой обычный кейс - это ELK. ELK - это я хочу искать сразу по получении. но могу делать мелкие индексы.

ptchol
15.05.2016
19:37:43
и вот это как то очень сомнительно )
а активных доков сколько ?
вы же наверно закрываете индексы ?

Google

Daniel
15.05.2016
19:38:14
да
конечно
но это мы деньги экономим

ptchol
15.05.2016
19:38:39
точнее так. по какому количеству доков ищете обычно ?

Daniel
15.05.2016
19:39:13
обычно ищем по текущим суткам
примерно 1К строк в секунду
поискать раньше - это надо индексы пооткрывать

ptchol
15.05.2016
19:40:01
85м в сутки.
+\-

Daniel
15.05.2016
19:40:08
ага
меньше
ночью все же есть спад

Daniel
15.05.2016
19:40:27
был
это было моим кошмаром весь 2014

ptchol
15.05.2016
19:41:03
одна нода или сколько ?
и диски какие рейд 10 какой нибудь из обычных ? или ссд ?

Daniel
15.05.2016
19:44:07
5 нод
replication factor 3
так что никакого 10
и, в общем, все работало

Google

Daniel
15.05.2016
19:45:20
только индекс раз в час новый появлялся

ptchol
15.05.2016
19:49:16
а шардов ?

Daniel
15.05.2016
19:51:25
256, кажется
не помню
оно у меня слегка с кассандрой в голове перепуталось
а документы по проекту уж на внешний винт уехали

Алексей
15.05.2016
20:10:16
вот вы этим мереньем мне сейчас всю малину обломали

Daniel
15.05.2016
20:10:29
а?

Алексей
15.05.2016
20:10:36

Admin
ERROR: S client not available

Daniel
15.05.2016
20:10:48
да

Алексей
15.05.2016
20:11:12
и это мало. и для этого нужны много нод ?

Daniel
15.05.2016
20:11:24
да
вернее - нет
много нод нужно для надежности

Алексей
15.05.2016
20:13:29
для логов надо много нод ? или для чего то более ценного ?

Daniel
15.05.2016
20:13:57
у нас логи были ценным

Алексей
15.05.2016
20:14:05
а ок.

ptchol
15.05.2016
20:27:05
мы ес под аналитику мучаем... и тяжело.

Daniel
15.05.2016
20:27:23
под аналитику он никак, по-моему

Google

ptchol
15.05.2016
20:27:27
тяжело потому что индексы нельзя как бы закрывать, и в постоянном скане несколько млрд объектов...
и в память это не вмещается никак. и постоянные скана дисков...

Daniel
15.05.2016
20:28:23
ну я больше 500М пока ни в какую базу не складывал ничего
500М в активе, конечно же
в закрытых индексах сколько угодно может лежать

ptchol
15.05.2016
20:28:59
кстате. вы же делали обзор ФС распредленной на одном из хайлоадов ?
*распределенных

Daniel
15.05.2016
20:29:20
да

ptchol
15.05.2016
20:29:35
что то изучали с тех времен ? )
может эксплуатировали.

Daniel
15.05.2016
20:29:58
та фс переехала на кассандру
и касссандру я теперь зову сосандрой

ptchol
15.05.2016
20:30:26
прям данные хроните там блобами ?

Daniel
15.05.2016
20:30:43
чанками по 64К

ptchol
15.05.2016
20:31:18
тоска. это она сама так ? как риак ?

Daniel
15.05.2016
20:31:56
как раз риака я не пробовал
почему-то
она mmap files использует
это, как выяснилось, означает 100% утилизации диска на чтение

ptchol
15.05.2016
20:32:36
риак бьет бинарные данные на куски по 4кб и распихивает.

Daniel
15.05.2016
20:32:47
даже при небольшом количестве запросов

ptchol
15.05.2016
20:33:08
а были тесты ceph/swift ?