
sherzod
26.03.2018
17:27:14
Нет ну можно сэмулировать namenode-у, которая для записи будет отдавать адрес нужного инстанса БД, и писать в эту кучу независимых БД. Потом накрутить движок вычислений поверх этого. Получится хадуп :)

Oleksandr
26.03.2018
17:28:55
https://github.com/sorintlab/stolon

sherzod
26.03.2018
17:29:42
Это HA
Если коротко базы не масштабируются.

Google

Tsh
26.03.2018
17:30:16

Oleksandr
26.03.2018
17:30:45
Тогда у меня какое то неправильное понимание горизонтального масштабирования.

sherzod
26.03.2018
17:31:02

Grigory
26.03.2018
17:45:53

Oleksandr
26.03.2018
17:58:17

Vladislav
26.03.2018
18:36:03

sherzod
26.03.2018
18:36:25
Почему?

Vladislav
26.03.2018
18:36:54
Потому что обычно это в вертикальном

sherzod
26.03.2018
18:37:48
Не понятно, можно разъяснить подробнее?

Vladislav
26.03.2018
18:39:02
Горизонтальное масштабирование может давать параллельность обработки, но не дает гарантий сокращения времени получения информации

sherzod
26.03.2018
18:40:24
Всё равно непонятно. Если я делаю фулскан, фильтр строк по регекспу например, я не должен ожидать что при большем кол-ве нод это отработает быстрее?

Vladislav
26.03.2018
18:42:07
А если вы будете делать по условию, которое находится на одной ноде?

Google

sherzod
26.03.2018
18:42:49
А кажется понял, вы имеете в виду не всякий алгоритм горизонтально масштабируется? Так вроде никто про это ничего не говорил.

Vladislav
26.03.2018
18:42:54
Есть k-safe, но и он не даст сокращение времени пропорционально количеству нод

sherzod
26.03.2018
18:44:54
Мы говорим про чтение и запись. Про алгоритмы речи не идёт, очевидно.
Ну вернее идёт если алгоритм параллелится.

Vladislav
26.03.2018
18:45:31
Так я про то, как писать и читать

sherzod
26.03.2018
18:46:48

Vladislav
26.03.2018
18:47:22
Про то, как писать

sherzod
26.03.2018
18:49:45
ну такими аргументами мы далеко не уйдём)

Vladislav
26.03.2018
18:56:30
Когда пишем, мы тратим время на реплику, чтобы параллелить. Когда параллелим, мы тратим время на сбор данных на одной ноде после параллеливания. При двух нодах никогда не будет сокращение времени в двое априори
Ну и горизонтальное масштабирование делают не столько для параллели, сколько для отказаустойчивости. Поэтому реальный выхлоп от количества нод 2k+1 будет в лучшем случае k

sherzod
26.03.2018
19:06:36
У вас есть обрывки верных мыслей, но в целом всё не так.
2k+1 -> k это вы откуда-то вырвали из какой-то доки по MR и обобщаете на всё. Конечно же для распараллеливания, это была основная цель.
Пересечения с отказоустойчивостью есть обширные. Но утверждать что это для HA а не для ускорения - неверно.
Берём простой фулскан, каждую строку в данных заменяем на её половину. Где тут 2k+1 -> k, непонятно.

Vladislav
26.03.2018
19:26:50
Просто вы мыслите только в рамках HA, я же мыслю в рамках баз, в основном реляционных

Andrew
26.03.2018
19:48:29
кто-нибудь настраивал SSL на клоудере?

Konstantin
27.03.2018
02:46:43

Andrew
27.03.2018
08:06:48
Было дело.
Есть какой-нибудь толковый гайд по этому делу?

Konstantin
27.03.2018
08:12:16
Только дока с их сайта. Я не ней делал
Т9 блин.. я по ней делал

Danis
27.03.2018
08:39:24

Google

Andrew
27.03.2018
08:42:02
Я делал.
Тоже по доке? На сколько нод кластер?

Danis
27.03.2018
08:42:54
Что-то по доке, что-то коллеги подсказали.

Konstantin
27.03.2018
10:42:30
#job
В один из крупных банков России требуется системный администратор Hadoop.
Заниматься предстоит
- Установка, настройка и поддержка различных компонентов экосистемы Hadoop.
- Разработка DR решений.
- интеграцией Big Data решений с системами банка;
- разработка системы подготовки банковской отчетности
- участие в DevOps процессах обслуживания и развития распределенного кластера и устранения неполадок.
Надо иметь опыт
- администрирования ОС семейства Linux.
- внедрения и поддержки кластеров данных на основе экосистемы Hadoop (HDFS, YARN, MapReduce, Spark, Impala).
- Желательно опыт работы с Cloudera сборкой.
- работы с высоконагруженными системами 24/7
Знание английского, языков программирования (java, python ...), OpenSource инструментов – очень приветствуется.
ЗП 150-170 net после собеседования, ДМС. Офис в центре Москвы.

Daniel
27.03.2018
13:22:38
кто-нить уже завел хадупа с 10ой jdk?

Grigory
27.03.2018
13:29:07
на девятой то вроде бывают проблемы

Daniel
27.03.2018
13:32:34
у нас сходу 10ка не завелась, интересно имеет ли смысл ковыряться или забить пока

Grigory
27.03.2018
13:37:54
забей зачем она?)

Daniel
27.03.2018
13:38:50
еще более втюненый г1 и грааль
ну лан, хрен с ним с гц, грааль

Александр
27.03.2018
13:39:19
заводил но не на spark

Daniel
27.03.2018
13:39:28
так и я не про спарк

Александр
27.03.2018
13:39:44
в ближайщии дни дажее планировал померять с графиками итд
у меня g1 в 8 нормально 50гб оперативы отрабатывает, но все равно интересно померять

Nick
27.03.2018
13:41:11

Daniel
27.03.2018
13:41:44

Nick
27.03.2018
13:42:04
а почему нет?

Александр
27.03.2018
13:43:03
*не спарк и не hadoop, просто scala сервис

Tsh
27.03.2018
14:01:15
Смысл в десятке, если она будет допиливаться + хадуп экосистема не перешла на 9

Daniel
27.03.2018
14:02:11
что значит 10ка будет допиливаться? через полгода 11

Google

Tsh
27.03.2018
14:02:25
Кстати были статьи что спарк и флинк в некоторых задачах лучше использовать не с г1 а с кмс

Daniel
27.03.2018
14:03:08
вот тут надо опять же версии jvm уточнять, потому что g1 8ки, 9ки и 10ки не одно и тоже
в последнем случае сильно (паралелльная сборка одного из этапов)

Alexey
27.03.2018
14:07:22
11 это LTS, на неё и есть смысл смотреть. десятка вообще не актуальна, её поддерживать не будут.

Daniel
27.03.2018
14:10:30
%)

Grigory
27.03.2018
14:22:11
да и 9ка тож

Alexey
27.03.2018
14:26:42
угу. девятку потыкать тока ради новых фич

Dmitry
27.03.2018
14:27:41
Мне кажется, ближайшие годы все будут сидеть на 8, и глядя на очередной скорострельный релиз Java думать "что это было?" или "шо, опять?!". :-)
А так же читать блог-посты тех, кто не сбился со счёта и решил поэкспериментировать с очередной новой джавой.

Daria
27.03.2018
14:29:55
а также рублики неочевидное и невероятное в jave x

Daniel
27.03.2018
14:32:06
и сидеть на спарке 1.6, а по пятницам в баре вспоминать причмокивая времена джавы 6 и спарка 1.3

Dmitry
27.03.2018
14:33:02

Alexey
27.03.2018
14:34:11
ну вот когда все зависимости переползут на лтс, тогда и мы подтянемся... через годик.
а ораклы его каждые два года новый собираются выпускать?

Dmitry
27.03.2018
14:50:18
а ораклы его каждые два года новый собираются выпускать?
сложный вопрос...
http://www.oracle.com/technetwork/java/eol-135779.html
9ка вообще анонсируется как переходная, типа - сваливайте с нее как только сможете
по поводу 10ки - я не до конца табличку понял..
возможно как в убунте будет - раз в пол года релиз, и LTS с какой то продленной поддержкой?

Akceptor
27.03.2018
14:53:37
LTS будет 11

Dmitry
27.03.2018
14:55:16
Есть какой-то не новый проект на Java, выходит новая Java. Проект не тривиальный, нужен период ожидания, пока пофиксят косяки новой версии, пока проверят совместимость новой версии с кодом проекта, - и тут же выходит следующая версия Java. И так далее.
Скромнее надо быть с темпом релизов, IMHO. Давать время освоиться.

Dmitry
27.03.2018
14:59:43
ну с 9кой фактически уже поигрались немного - проект запустился с ней без каких то танцов с бубном...
если кто любит спринг с хибернейтом - то у них будут некоторые проблемы - но они лечатся изменением строки запуска
https://dou.ua/lenta/articles/problems-with-java-9/

Google

Akceptor
27.03.2018
15:00:04
ну так будут переходить с одного LTS на другой, полтора года как минимум. по крайней мере у нас план таков

Rimma
27.03.2018
15:14:29
#job #вакансия #москва
Добрый вечер! Ищу в команду DBA по направлению Big Data – в крупную процессинговую компанию. Описание здесь: https://hh.ru/vacancy/24204641
По поводу зарплаты – не могу, к сожалению, озвучить вилку, но компания опирается на требования кандидата и предлагает очень привлекательные условия.

Dmitry
27.03.2018
15:15:40
Вилку озвучить - придётся.

Alexey
27.03.2018
15:18:28
угу. значит, как выйдет 11, переползём на неё, потому что 8 будет без поддержки. потом до следующего лтс опять можно спокойно игнорировать года полтора все релизы.

Александр
27.03.2018
15:19:49

Dmitry
27.03.2018
15:23:02
Не, ну когда их все изучать, проверять, обкатывать в production, если их штампуют в таком темпе?
Я про 9+
Раньше как-то проще и понятнее было.

Александр
27.03.2018
15:24:03
про модули в 9 уже говорят с 7 версии, вроде бы как

Alexey
27.03.2018
15:25:44
одно дело говорят, другое дело как реализуют в итоге
мы вот приложение на 1.3 MLoC с 6 на 8 мигрировали — пришлось только пару сотен тестов подправить, да всякие мелочи. в принципе, нормально вышло с обратной совместимостью.
но с отдельно стоявшими кусками, которые на скале были написаны, возились очень долго

Dmitry
27.03.2018
15:32:43
Надо было сразу на Scala всё писать. :-)

Dmitry
27.03.2018
15:35:33
кстати да.. java и scala совместно живут конечно.. но как то совсем криво и неудобно

Alexey
27.03.2018
15:35:44
скала это write-only язык. когда у тебя два человека c PhD одну лямбду под спарк пишут в четыре руки, то ещё ничё. а вот если три десятка обалдуев без особого образования пилят ынторпрайзного монстра, то несколько иной коленкор.
скала там только отдельно стоящим модулем.

Grigory
27.03.2018
15:36:13

Alexey
27.03.2018
15:36:21
:))

Grigory
27.03.2018
15:36:47
и тип стратегии; at least once, etc

Tsh
27.03.2018
15:39:44
Перловка