@hadoopusers

Страница 89 из 182

sherzod

26.03.2018
17:27:14

Нет ну можно сэмулировать namenode-у, которая для записи будет отдавать адрес нужного инстанса БД, и писать в эту кучу независимых БД. Потом накрутить движок вычислений поверх этого. Получится хадуп :)

Oleksandr

26.03.2018
17:28:55

https://github.com/sorintlab/stolon

sherzod

26.03.2018
17:29:42

Это HA

Если коротко базы не масштабируются.

Google

Tsh

26.03.2018
17:30:16

Нет ну можно сэмулировать namenode-у, которая для записи будет отдавать адрес нужного инстанса БД, и писать в эту кучу независимых БД. Потом накрутить движок вычислений поверх этого. Получится хадуп :)

Это называется greenplum

Oleksandr

26.03.2018
17:30:45

Тогда у меня какое то неправильное понимание горизонтального масштабирования.

sherzod

26.03.2018
17:31:02

Это называется greenplum

Есть ещё Pg XC, PG XL

Тогда у меня какое то неправильное понимание горизонтального масштабирования.

Если попробовать коротко, должна быть возможность писать количеством клиентов пропорциональным размеру кластера. И иметь возможность прошерстить все данные за время обратно пропорциональное размеру кластера.

Grigory

26.03.2018
17:45:53

Тогда у меня какое то неправильное понимание горизонтального масштабирования.

Жертва маркетинга прост ):

Oleksandr

26.03.2018
17:58:17

Жертва маркетинга прост ):

СТОКГОЛЬМСКИЙ СИНДРОМ

Vladislav

26.03.2018
18:36:03

Если попробовать коротко, должна быть возможность писать количеством клиентов пропорциональным размеру кластера. И иметь возможность прошерстить все данные за время обратно пропорциональное размеру кластера.

Насчет времени спорно

sherzod

26.03.2018
18:36:25

Почему?

Vladislav

26.03.2018
18:36:54

Потому что обычно это в вертикальном

sherzod

26.03.2018
18:37:48

Не понятно, можно разъяснить подробнее?

Vladislav

26.03.2018
18:39:02

Горизонтальное масштабирование может давать параллельность обработки, но не дает гарантий сокращения времени получения информации

sherzod

26.03.2018
18:40:24

Всё равно непонятно. Если я делаю фулскан, фильтр строк по регекспу например, я не должен ожидать что при большем кол-ве нод это отработает быстрее?

Vladislav

26.03.2018
18:42:07

А если вы будете делать по условию, которое находится на одной ноде?

Google

sherzod

26.03.2018
18:42:49

А кажется понял, вы имеете в виду не всякий алгоритм горизонтально масштабируется? Так вроде никто про это ничего не говорил.

Vladislav

26.03.2018
18:42:54

Есть k-safe, но и он не даст сокращение времени пропорционально количеству нод

sherzod

26.03.2018
18:44:54

Мы говорим про чтение и запись. Про алгоритмы речи не идёт, очевидно.

Ну вернее идёт если алгоритм параллелится.

Vladislav

26.03.2018
18:45:31

Так я про то, как писать и читать

sherzod

26.03.2018
18:46:48

А если вы будете делать по условию, которое находится на одной ноде?

Это что означает?)

Vladislav

26.03.2018
18:47:22

Про то, как писать

sherzod

26.03.2018
18:49:45

ну такими аргументами мы далеко не уйдём)

Vladislav

26.03.2018
18:56:30

Когда пишем, мы тратим время на реплику, чтобы параллелить. Когда параллелим, мы тратим время на сбор данных на одной ноде после параллеливания. При двух нодах никогда не будет сокращение времени в двое априори

Ну и горизонтальное масштабирование делают не столько для параллели, сколько для отказаустойчивости. Поэтому реальный выхлоп от количества нод 2k+1 будет в лучшем случае k

sherzod

26.03.2018
19:06:36

У вас есть обрывки верных мыслей, но в целом всё не так. 2k+1 -> k это вы откуда-то вырвали из какой-то доки по MR и обобщаете на всё. Конечно же для распараллеливания, это была основная цель.

Пересечения с отказоустойчивостью есть обширные. Но утверждать что это для HA а не для ускорения - неверно.

Берём простой фулскан, каждую строку в данных заменяем на её половину. Где тут 2k+1 -> k, непонятно.

Vladislav

26.03.2018
19:26:50

Просто вы мыслите только в рамках HA, я же мыслю в рамках баз, в основном реляционных

Andrew

26.03.2018
19:48:29

кто-нибудь настраивал SSL на клоудере?

Konstantin

27.03.2018
02:46:43

кто-нибудь настраивал SSL на клоудере?

Было дело.

Andrew

27.03.2018
08:06:48

Было дело.

Есть какой-нибудь толковый гайд по этому делу?

Konstantin

27.03.2018
08:12:16

Только дока с их сайта. Я не ней делал

Т9 блин.. я по ней делал

Danis

27.03.2018
08:39:24

кто-нибудь настраивал SSL на клоудере?

Я делал.

Google

Andrew

27.03.2018
08:42:02

Я делал.

Тоже по доке? На сколько нод кластер?

Danis

27.03.2018
08:42:54

Тоже по доке? На сколько нод кластер?

Это почти неважно.

Что-то по доке, что-то коллеги подсказали.

Konstantin

27.03.2018
10:42:30

#job В один из крупных банков России требуется системный администратор Hadoop. Заниматься предстоит - Установка, настройка и поддержка различных компонентов экосистемы Hadoop. - Разработка DR решений. - интеграцией Big Data решений с системами банка; - разработка системы подготовки банковской отчетности - участие в DevOps процессах обслуживания и развития распределенного кластера и устранения неполадок. Надо иметь опыт - администрирования ОС семейства Linux. - внедрения и поддержки кластеров данных на основе экосистемы Hadoop (HDFS, YARN, MapReduce, Spark, Impala). - Желательно опыт работы с Cloudera сборкой. - работы с высоконагруженными системами 24/7 Знание английского, языков программирования (java, python ...), OpenSource инструментов – очень приветствуется. ЗП 150-170 net после собеседования, ДМС. Офис в центре Москвы.

Daniel

27.03.2018
13:22:38

кто-нить уже завел хадупа с 10ой jdk?

Grigory

27.03.2018
13:29:07

на девятой то вроде бывают проблемы

Daniel

27.03.2018
13:32:34

у нас сходу 10ка не завелась, интересно имеет ли смысл ковыряться или забить пока

Grigory

27.03.2018
13:37:54

забей зачем она?)

Daniel

27.03.2018
13:38:50

еще более втюненый г1 и грааль

ну лан, хрен с ним с гц, грааль

Александр

27.03.2018
13:39:19

заводил но не на spark

Daniel

27.03.2018
13:39:28

так и я не про спарк

Александр

27.03.2018
13:39:44

в ближайщии дни дажее планировал померять с графиками итд

у меня g1 в 8 нормально 50гб оперативы отрабатывает, но все равно интересно померять

Nick

27.03.2018
13:41:11

кто-нить уже завел хадупа с 10ой jdk?

а это возможно?

Daniel

27.03.2018
13:41:44

а это возможно?

зачем ты задаешь на мой вопрос такой же вопрос?)

Nick

27.03.2018
13:42:04

а почему нет?

Александр

27.03.2018
13:43:03

*не спарк и не hadoop, просто scala сервис

Tsh

27.03.2018
14:01:15

Смысл в десятке, если она будет допиливаться + хадуп экосистема не перешла на 9

Daniel

27.03.2018
14:02:11

что значит 10ка будет допиливаться? через полгода 11

Google

Tsh

27.03.2018
14:02:25

Кстати были статьи что спарк и флинк в некоторых задачах лучше использовать не с г1 а с кмс

Daniel

27.03.2018
14:03:08

вот тут надо опять же версии jvm уточнять, потому что g1 8ки, 9ки и 10ки не одно и тоже

в последнем случае сильно (паралелльная сборка одного из этапов)

Alexey

27.03.2018
14:07:22

11 это LTS, на неё и есть смысл смотреть. десятка вообще не актуальна, её поддерживать не будут.

Daniel

27.03.2018
14:10:30

%)

Grigory

27.03.2018
14:22:11

да и 9ка тож

Alexey

27.03.2018
14:26:42

угу. девятку потыкать тока ради новых фич

Admin

ERROR: S client not available

Dmitry

27.03.2018
14:27:41

Мне кажется, ближайшие годы все будут сидеть на 8, и глядя на очередной скорострельный релиз Java думать "что это было?" или "шо, опять?!". :-)

А так же читать блог-посты тех, кто не сбился со счёта и решил поэкспериментировать с очередной новой джавой.

Daria

27.03.2018
14:29:55

а также рублики неочевидное и невероятное в jave x

Daniel

27.03.2018
14:32:06

и сидеть на спарке 1.6, а по пятницам в баре вспоминать причмокивая времена джавы 6 и спарка 1.3

Dmitry

27.03.2018
14:33:02

Мне кажется, ближайшие годы все будут сидеть на 8, и глядя на очередной скорострельный релиз Java думать "что это было?" или "шо, опять?!". :-)

поддержка уже почти закончилась у 8ки, security-update-ов не будет, так что не будут сидеть.. хочешь-не хочешь, а переходить надо

Alexey

27.03.2018
14:34:11

ну вот когда все зависимости переползут на лтс, тогда и мы подтянемся... через годик.

а ораклы его каждые два года новый собираются выпускать?

Dmitry

27.03.2018
14:50:18

а ораклы его каждые два года новый собираются выпускать?

сложный вопрос... http://www.oracle.com/technetwork/java/eol-135779.html 9ка вообще анонсируется как переходная, типа - сваливайте с нее как только сможете по поводу 10ки - я не до конца табличку понял.. возможно как в убунте будет - раз в пол года релиз, и LTS с какой то продленной поддержкой?

Akceptor

27.03.2018
14:53:37

LTS будет 11

Dmitry

27.03.2018
14:55:16

ну вот когда все зависимости переползут на лтс, тогда и мы подтянемся... через годик.

Типа того.

Есть какой-то не новый проект на Java, выходит новая Java. Проект не тривиальный, нужен период ожидания, пока пофиксят косяки новой версии, пока проверят совместимость новой версии с кодом проекта, - и тут же выходит следующая версия Java. И так далее.

Скромнее надо быть с темпом релизов, IMHO. Давать время освоиться.

Google

Dmitry

27.03.2018
14:59:43

ну с 9кой фактически уже поигрались немного - проект запустился с ней без каких то танцов с бубном... если кто любит спринг с хибернейтом - то у них будут некоторые проблемы - но они лечатся изменением строки запуска https://dou.ua/lenta/articles/problems-with-java-9/

Akceptor

27.03.2018
15:00:04

ну так будут переходить с одного LTS на другой, полтора года как минимум. по крайней мере у нас план таков

Rimma

27.03.2018
15:14:29

#job #вакансия #москва Добрый вечер! Ищу в команду DBA по направлению Big Data – в крупную процессинговую компанию. Описание здесь: https://hh.ru/vacancy/24204641 По поводу зарплаты – не могу, к сожалению, озвучить вилку, но компания опирается на требования кандидата и предлагает очень привлекательные условия.

Dmitry

27.03.2018
15:15:40

Вилку озвучить - придётся.

Alexey

27.03.2018
15:18:28

угу. значит, как выйдет 11, переползём на неё, потому что 8 будет без поддержки. потом до следующего лтс опять можно спокойно игнорировать года полтора все релизы.

Александр

27.03.2018
15:19:49

угу. значит, как выйдет 11, переползём на неё, потому что 8 будет без поддержки. потом до следующего лтс опять можно спокойно игнорировать года полтора все релизы.

помню прекрасно момент, когда вышла java8 а в компании с умным видом объясняли соискателям почему java6 пока лучшее решение

Dmitry

27.03.2018
15:23:02

Не, ну когда их все изучать, проверять, обкатывать в production, если их штампуют в таком темпе?

Я про 9+

Раньше как-то проще и понятнее было.

Александр

27.03.2018
15:24:03

про модули в 9 уже говорят с 7 версии, вроде бы как

Alexey

27.03.2018
15:25:44

одно дело говорят, другое дело как реализуют в итоге

мы вот приложение на 1.3 MLoC с 6 на 8 мигрировали — пришлось только пару сотен тестов подправить, да всякие мелочи. в принципе, нормально вышло с обратной совместимостью.

но с отдельно стоявшими кусками, которые на скале были написаны, возились очень долго

Dmitry

27.03.2018
15:32:43

Надо было сразу на Scala всё писать. :-)

Dmitry

27.03.2018
15:35:33

кстати да.. java и scala совместно живут конечно.. но как то совсем криво и неудобно

Alexey

27.03.2018
15:35:44

скала это write-only язык. когда у тебя два человека c PhD одну лямбду под спарк пишут в четыре руки, то ещё ничё. а вот если три десятка обалдуев без особого образования пилят ынторпрайзного монстра, то несколько иной коленкор. скала там только отдельно стоящим модулем.

Grigory

27.03.2018
15:36:13

скала это write-only язык. когда у тебя два человека c PhD одну лямбду под спарк пишут в четыре руки, то ещё ничё. а вот если три десятка обалдуев без особого образования пилят ынторпрайзного монстра, то несколько иной коленкор. скала там только отдельно стоящим модулем.

а есть рид онли языки?

Alexey

27.03.2018
15:36:21

:))

Grigory

27.03.2018
15:36:47

и тип стратегии; at least once, etc

Tsh

27.03.2018
15:39:44

Перловка

« Назад

Страница 89 из 182

Далее »

Открыть в Telegram