@devops_ru

Страница 136 из 4568
Daniel
15.05.2016
19:25:04
чтобы что?

ptchol
15.05.2016
19:25:17
если у вас пара лямов документов и 3 ноды с ССД , то как бы наверно да работает

и 2 с половиной индекса

Daniel
15.05.2016
19:25:33
не

Google
Daniel
15.05.2016
19:25:52
тут не количество индексов важно, а количество документов

ptchol
15.05.2016
19:26:00
как фильтр и классифкатор (фасеты там всякие) оно ок. но вот реально работа с индесами и поиск - ну не айс же.

Daniel
15.05.2016
19:26:04
как раз на паре лямов обновление встает колом

и надо открывать новый индекс

ptchol
15.05.2016
19:26:43
а еще принципиальное отсутсвие шедулинга в кааком либо виде внутри

нет возможности даже бегущие квери убить

Daniel
15.05.2016
19:27:07
раз впилили update on request - значит и шедулинг появился

но - это же все про другое

ptchol
15.05.2016
19:27:29
я про то что доступно пользователю конечному

а еще их позиция "филдсет ин мемори чтобы хоть как то работало" это вобще для каких людей ?

Daniel
15.05.2016
19:28:55
для богатых

не

я довольно агрессивно выступил

Google
Daniel
15.05.2016
19:29:25
на самом деле - я хорошо знаю, что ES говно

ptchol
15.05.2016
19:29:32
я знаю одних людей у которых ЕС хорошо пашет. но у них ноды со 128гб и фьюжн ио в дисках.

и то сука течет и память в ОЛДе засирается в результате ГЦ постоянно коллектит мусор и рестратить приходится.

Daniel
15.05.2016
19:33:35
но кейс “поисковик на ноде и es” - это не про ноду

пробллема-то не в этом всем

это все норм

текущую память можно фиксить

у него родовая травма есть

ptchol
15.05.2016
19:34:41
серьезно ?) а мы не знаааааали )

Daniel
15.05.2016
19:34:43
он, сцуко, все время компактит свои листья

и нагрузку на диски минимум удваивает

а в нормальной ситуации - утраивает

и вот это уже не победить

ptchol
15.05.2016
19:36:20
если вам не нужно тут же уметь искать данные после получения, можно просто реже флашить на диск их

я к тому что компенсировать можно.

просто есть мнение что ЕС удобен для аналитки

Daniel
15.05.2016
19:37:33
мой обычный кейс - это ELK. ELK - это я хочу искать сразу по получении. но могу делать мелкие индексы.

ptchol
15.05.2016
19:37:43
и вот это как то очень сомнительно )

а активных доков сколько ?

вы же наверно закрываете индексы ?

Google
Daniel
15.05.2016
19:38:14
да

конечно

но это мы деньги экономим

ptchol
15.05.2016
19:38:39
точнее так. по какому количеству доков ищете обычно ?

Daniel
15.05.2016
19:39:13
обычно ищем по текущим суткам

примерно 1К строк в секунду

поискать раньше - это надо индексы пооткрывать

ptchol
15.05.2016
19:40:01
85м в сутки.

+\-

Daniel
15.05.2016
19:40:08
ага

меньше

ночью все же есть спад

Daniel
15.05.2016
19:40:27
был

это было моим кошмаром весь 2014

ptchol
15.05.2016
19:41:03
одна нода или сколько ?

и диски какие рейд 10 какой нибудь из обычных ? или ссд ?

Daniel
15.05.2016
19:44:07
5 нод

replication factor 3

так что никакого 10

и, в общем, все работало

Google
Daniel
15.05.2016
19:45:20
только индекс раз в час новый появлялся

ptchol
15.05.2016
19:49:16
а шардов ?

Daniel
15.05.2016
19:51:25
256, кажется

не помню

оно у меня слегка с кассандрой в голове перепуталось

а документы по проекту уж на внешний винт уехали

Алексей
15.05.2016
20:10:16
вот вы этим мереньем мне сейчас всю малину обломали

Daniel
15.05.2016
20:10:29
а?

Алексей
15.05.2016
20:10:36
85м в сутки.
это же 1000 записей в секунду

Admin
ERROR: S client not available

Daniel
15.05.2016
20:10:48
да

Алексей
15.05.2016
20:11:12
и это мало. и для этого нужны много нод ?

Daniel
15.05.2016
20:11:24
да

вернее - нет

много нод нужно для надежности

Алексей
15.05.2016
20:13:29
для логов надо много нод ? или для чего то более ценного ?

Daniel
15.05.2016
20:13:57
у нас логи были ценным

Алексей
15.05.2016
20:14:05
а ок.

ptchol
15.05.2016
20:27:05
мы ес под аналитику мучаем... и тяжело.

Daniel
15.05.2016
20:27:23
под аналитику он никак, по-моему

Google
ptchol
15.05.2016
20:27:27
тяжело потому что индексы нельзя как бы закрывать, и в постоянном скане несколько млрд объектов...

и в память это не вмещается никак. и постоянные скана дисков...

Daniel
15.05.2016
20:28:23
ну я больше 500М пока ни в какую базу не складывал ничего

500М в активе, конечно же

в закрытых индексах сколько угодно может лежать

ptchol
15.05.2016
20:28:59
кстате. вы же делали обзор ФС распредленной на одном из хайлоадов ?

*распределенных

Daniel
15.05.2016
20:29:20
да

ptchol
15.05.2016
20:29:35
что то изучали с тех времен ? )

может эксплуатировали.

Daniel
15.05.2016
20:29:58
та фс переехала на кассандру

и касссандру я теперь зову сосандрой

ptchol
15.05.2016
20:30:26
прям данные хроните там блобами ?

Daniel
15.05.2016
20:30:43
чанками по 64К

ptchol
15.05.2016
20:31:18
тоска. это она сама так ? как риак ?

Daniel
15.05.2016
20:31:56
как раз риака я не пробовал

почему-то

она mmap files использует

это, как выяснилось, означает 100% утилизации диска на чтение

ptchol
15.05.2016
20:32:36
риак бьет бинарные данные на куски по 4кб и распихивает.

Daniel
15.05.2016
20:32:47
даже при небольшом количестве запросов

ptchol
15.05.2016
20:33:08
а были тесты ceph/swift ?

Страница 136 из 4568