
KrivdaAllStars
17.07.2018
12:56:37
https://mmlspark.blob.core.windows.net/website/index.html

Sergioss
17.07.2018
13:07:57

Евгений
17.07.2018
13:08:55
Ну, если работает, конечно)

Alexey
17.07.2018
13:39:59
ну фиг знает может sshd нестандартным путям какой-нить apparmor доступа не даёт

Google

Alexey
17.07.2018
13:40:37
или что там щас в дистрибы для пущей безопастности пихают. systemd какой-нить.

Sergioss
17.07.2018
15:25:15
парни будьте любезны если у кого то есть дельный ман, желательно под cent поделитесь плз

Alexey
17.07.2018
15:39:32
а. ну, значит кривой конфиг, как обычно. причина 90% ошибок.

Sergioss
17.07.2018
15:44:51

Alexey
17.07.2018
15:58:05
ну тогда остаётся одна причина. мистический подземный стук и влияние ящериков с Нибиру.


Andrey
17.07.2018
23:09:25
https://thenewstack.io/ci-cd-with-kubernetes-tools-and-practices/?utm_medium=email&utm_source=topic+optin&utm_campaign=awareness&utm_content=20180716+webops+nl&mkt_tok=eyJpIjoiTWpsallqZGxPR1ptWldFeiIsInQiOiJjekZQRkwxdjZ4NVZueFJTd3ZjYkE1cFpnejlyXC9OaXV5MWNvdWVzck9Fc1NsbEM2dzQxYTlFR0dLbWw4bURhUGt3WGhYR1Z5Q2NCXC8wWlpiR3ZWYTlEa3VzelYwNHBXUjMrNFwvS0xoNFYxUzJNbm5ocXNpQmN0SHRyY0kybWxFWiJ9
https://devops.com/does-devops-engineer-exist-how-beliefs-can-influence-hiring/?utm_medium=email&utm_source=topic+optin&utm_campaign=awareness&utm_content=20180716+webops+nl&mkt_tok=eyJpIjoiTWpsallqZGxPR1ptWldFeiIsInQiOiJjekZQRkwxdjZ4NVZueFJTd3ZjYkE1cFpnejlyXC9OaXV5MWNvdWVzck9Fc1NsbEM2dzQxYTlFR0dLbWw4bURhUGt3WGhYR1Z5Q2NCXC8wWlpiR3ZWYTlEa3VzelYwNHBXUjMrNFwvS0xoNFYxUzJNbm5ocXNpQmN0SHRyY0kybWxFWiJ9
Goodbye microservices: From 100s of problem children to 1 superstar
Segment adopted microservices as a best practice early-on, which served the company well in some cases and not so well in others. Alexandra Noonan explains why microservices worked at first and then how and why Segment made a transition to monolith.
https://segment.com/blog/goodbye-microservices/?utm_medium=email&utm_source=topic+optin&utm_campaign=awareness&utm_content=20180716+webops+nl&mkt_tok=eyJpIjoiTWpsallqZGxPR1ptWldFeiIsInQiOiJjekZQRkwxdjZ4NVZueFJTd3ZjYkE1cFpnejlyXC9OaXV5MWNvdWVzck9Fc1NsbEM2dzQxYTlFR0dLbWw4bURhUGt3WGhYR1Z5Q2NCXC8wWlpiR3ZWYTlEa3VzelYwNHBXUjMrNFwvS0xoNFYxUzJNbm5ocXNpQmN0SHRyY0kybWxFWiJ9
Workload-Aware Auto-Scaling is a modern architectural approach best suited for big data applications in the cloud that use open source technologies, like Hadoop, Spark, or Presto.
With Workload-Aware Auto-Scaling you can take full advantage of elastic cloud resources, by automatically scaling up when you need it, and down when you don’t, and stop wasting money on idle instances. http://www.qubole.com/wp-content/uploads/2017/11/Workload_Aware_Auto-Scaling-Qubole.pdf?mkt_tok=eyJpIjoiTkdVNE16UTJOMlppWXpFMyIsInQiOiJta05sWVppSHJHa2w5QjlicTRiRElna1N0WnQySm9kQ0NRYU9Jb1JEdmoxYkZlZmNIM3dGeVwvT1ZET1wvaVE1djNScmRGODRtYUpwMDMyZytZV3NZWkdBdXFTaXFxVVR1SzBQSW9neUxQQnlvMmtFa0ppNTQ5UTdBTWNadDR6Vmp6In0%3D


Grigory
18.07.2018
06:03:12
Andrey ты бот?)

Andriy
18.07.2018
07:10:15
ETL tools что это? Часто вакансиях вижу.

Google

Daniel
18.07.2018
07:11:02
это все что угодно, что позволяет переложить данные из а в б
с возможными трансформациями
например хадупные шляпы, кафки
или просто cat

Andriy
18.07.2018
07:17:19
Более менее представляю. Спасибо

Andrey
18.07.2018
09:19:01
Andrey ты бот?)
Все люди - боты, только сложные из-за большой нейронной сетки

Grigory
18.07.2018
09:19:18
мне уже сообщили

Taras
18.07.2018
10:42:04

Daniel
18.07.2018
10:43:34
шляпы | хреновинки | штуки

Grigory
18.07.2018
10:52:50
ботинки

KrivdaAllStars
18.07.2018
11:22:44
Хорошая статья на эту тему, не помню, где нашёл.
https://medium.com/@maximebeauchemin/functional-data-engineering-a-modern-paradigm-for-batch-data-processing-2327ec32c42a

Alexey
18.07.2018
11:36:05
^ капитанство какое-то. впрочем, неплохой интродакшен в тему для самых маленьких.

Andriy
18.07.2018
12:07:41
А по русски?

Peter
18.07.2018
12:10:51
По-русски определительные наречия уподобления, образованные от прилагательных, с окончаниями –ему, -ому, -цки, -ски, -ьи пишутся через дефис.

Andriy
18.07.2018
12:12:59
Прочитал

Sergioss
18.07.2018
14:33:30
Ребят
подскажите плз куда надо добавить датаноды и слейвы для нэймноды,
хочу чтоб было
name master
name slave
data0
data1
Мож есть ман какой проверенный, а то я шарахаюсь по инету и где протухло где нету где еше чего, да и знал бы как должно в итоге получится было бы проще)
в core? (p.s. я сообщао что я нубло))

Stanislav
18.07.2018
14:49:53
С таким описанием вопроса подходит ответ: в основную неймноду. А вообще у хадупа хорошая документация

Sergioss
18.07.2018
14:50:57

Andrew
18.07.2018
15:19:47

Google

Sergioss
18.07.2018
15:21:40
так я же описал ситуацию с гуглом

Andrew
18.07.2018
15:22:20

Sergioss
18.07.2018
15:22:41
Ну вот и все=)

ptchol
18.07.2018
16:15:37
А речь то о чем
О хдфс ?
Все это по-моему в core-site xml
Или hdfs site xml )

Sergioss
18.07.2018
16:26:08
Да вот и не знаю, но скорее всего речь о hdfs, после того как я настроил name (master) лью рсинком всю папку на дата ноду, и там я так понимаю должен ей указать что она дата и относиться к нэим ноде, для этого я в hdfs-site.xml указываю что то типа???
<property> <name>dfs.data.dir</name> <value>/opt/hadoop/dfs/name/data</value> <final>true</final> </property
И запускаю hdfs datanode start?
Мне тяжело с логикой, не понимаю пока что как оно должно работать, буду признателен если на 4 раз кто то кинет дельный Ман, чтоб я тупые вопросы не задавал

ptchol
18.07.2018
16:27:34
Да, но это после того как вы апнули журнал ноды и неймноды

Sergioss
18.07.2018
16:27:50

ptchol
18.07.2018
16:28:49
https://www.edureka.co/blog/how-to-set-up-hadoop-cluster-with-hdfs-high-availability/

Sergioss
18.07.2018
16:29:22
Посмотрю, спасибо большое!!!

ptchol
18.07.2018
16:30:14
Он рабочий, только там ещё йарн поднимают, это можно скипнуть там
Я по нему хдфс в докеры заворачивал

Sergioss
18.07.2018
16:30:49
Yarn это типа менеджер? Он у меня тоже есть и работает

ptchol
18.07.2018
16:31:29
Yarn это application scheduler
Yet another resource negotiator

Google

Sergioss
18.07.2018
16:33:30
Я по нему хдфс в докеры заворачивал
А для чего? Какую цель по мимо удобства приследовали? Я просто сейчас обучаюсь, мне сказали познакомиться с хадуп а потом запускать с дистрибутивов уже, но я планирую написать плейбук на все это дело.

ptchol
18.07.2018
16:35:32
Это менеджер ресурсов кластера. Он старается эффективно распределять ресурсы кластера (память, цпу) в условиях множественных конкурирующих задач

Sergioss
18.07.2018
16:37:08
Спасибо за ликбез!!!

Andrey
18.07.2018
23:04:23
https://www.oreilly.com/ideas/data-engineering-a-quick-and-simple-definition?utm_medium=email&utm_source=topic+optin&utm_campaign=awareness&utm_content=20180718+data+nl&mkt_tok=eyJpIjoiTm1Ka04yVTBaV0V4WmprNSIsInQiOiI1WVNSNGVrZTJJM2UwSzdsYmVMd0dUaXdBZGZMWnU2eWt0c3V3MmhldVZpdHZsQ2hsWFN0ZzlsUHY1K0s4SXdXK3V6dksrSWl0aHNvZGtVVllVVHN2OFJqazFJZXVZUUxYUFFCTnIra3YyNTN1TWFRbDJ3QmZrZG83eDZLK2ptViJ9
https://www.nytimes.com/2017/10/22/technology/artificial-intelligence-experts-salaries.html

Dan
19.07.2018
01:19:50
Добрый вечер, я тут резко сменил направление и надо быстро и относительно глубоко прокачать скиллы в Cassandra, Spark, Kafka. Бюджет на книги или видеокурсы есть, английский тоже. Посоветуйте плиз хороший набор книг или курсов, а то материала намного больше чем доступного времени и не хочется распыляться
ну или если это оффтопик, то канал где спросить, конечно

Andrey
19.07.2018
01:22:42

Dan
19.07.2018
01:23:30
так что меня больше интересует сама база и data modeling вокруг нее, и только потом все что к ней цепляется

Andrey
19.07.2018
01:25:54
Книжек и видео по Кассандре в сети - туча. Качните первые 10-15 книг и сами отберёте, что вам больше нравится

Dan
19.07.2018
01:26:44

Andrey
19.07.2018
01:27:42

Dan
19.07.2018
01:29:43
Не надо читать, надо посмотреть, что в них написано и выбрать
ну я привык взять книгу, пройтись по ней, и к концу процесса быть может и не монстром но уже хорошо подкованным для того чтоб дальше разобраться с гуглем пополам. А когда книг много, для такого результата надо подобрать одну-две, не более, иначе начинается распыление ресурсов и прочая прокрастинация

Andrey
19.07.2018
01:34:53
ну я привык взять книгу, пройтись по ней, и к концу процесса быть может и не монстром но уже хорошо подкованным для того чтоб дальше разобраться с гуглем пополам. А когда книг много, для такого результата надо подобрать одну-две, не более, иначе начинается распыление ресурсов и прочая прокрастинация
Отвыкайте, поток информации растёт экспненциально, Даже если кто-то посоветует, это не будет соответствовать Вашим требованиям. Учитесь плавать в море информации. выбирать, что читать, должны Вы.

Dan
19.07.2018
01:36:31

Andrey
19.07.2018
04:26:57
по кафке рекомендую kafka definitive guide от confluent
по спарку можно послушать курсы на курсере от яндекса и смотреть туториалы на оф сайте spark.apache.org

Vasilinka
19.07.2018
07:26:11
ребят, для скалы https://ru.wikipedia.org/wiki/Sbt весьма актуально? или большинство проектов на базе мавена со скала плагином

Google

Oleksandr
19.07.2018
07:26:59
впервые вижу ссылку на вики страницу сбт

Grigory
19.07.2018
07:27:04
На сбт все проекты, мавен забытая шляпа.

Oleksandr
19.07.2018
07:27:05
да, актуально

Евгений
19.07.2018
07:27:13
Сбт топчик

Grigory
19.07.2018
07:27:18
днище*

KrivdaAllStars
19.07.2018
07:27:30

Vasilinka
19.07.2018
07:27:50
thanks a lot

Grigory
19.07.2018
07:28:07
Кстати у нас там халявный фп спидран проходит, на скале
Сейчас правда на паузе слегка из-за недостатка времени