@bigdata_ru

Страница 6 из 327
Lepus
24.08.2016
15:06:55
Можно я буду ботом?

Ânu
24.08.2016
15:21:50
Зайчатки разума

Dan
24.08.2016
15:58:37
хотя вы знаете, коллеги, курс по бигдате за 180 тысяч рублей, это на самом деле даже интересно и любопытно

Alexey
24.08.2016
16:01:30
Google
Dan
24.08.2016
16:02:14
но мы же можем между собой в рамках сообщества делиться информацией и точно также развиваться в сфере бигдаты, нам даже особо хайп не нужен

Dan
24.08.2016
16:04:02
если брать лично меня, то мне очень много чего интересно. и natural language processing, и deep learning, и статистика

Alexey
24.08.2016
16:05:36
Ну так можно взять онлайн-курсы, где это дают без какого-то необходимого заранее уровня, а потом в книги

Dan
24.08.2016
16:05:43
при том, что в целом я много в чём разбираюсь, мне было бы углубить и расширить свои знания

нет, нет, я про ньюпролаб вообще рассуждал и их курс по большим данным )

Andrey
24.08.2016
16:07:08
Без решения практических задач углубленные знания забываются быстрее, чем их успеваешь в голову запихивать:)

Dan
24.08.2016
16:08:17
с практикой как раз проблем нет вообще, думаю что даже ближе к октябрю-ноябрю начнём искать студентов-математиков )

Lepus
24.08.2016
16:08:26
Но, в то же время, в большинстве бигдата

Мало кто реально хорошо шарит в теории

Andrey
24.08.2016
16:08:53
В смысле, куда искать студентов?

Dan
24.08.2016
16:09:33
к нам, ковырять бигдату

Google
Danila
24.08.2016
16:10:15
а откуда ты?

Andrey
24.08.2016
16:10:25
К вам - это к кому? И почему именно студентов?

Dan
24.08.2016
16:12:57
студентов для прохождения практики в том числе ) потому что студентам нужно проходить практику, а её у нас много. к нам - это к нам. кто мы и откуда мы - это вопросы, которые интересуют не только нас самих, но и каждого человека. откуда мы пришли, куда идём.. вы действительно хотите об этом поговорить? ?

Danila
24.08.2016
16:13:58
ты можешь просто ответить, где ты работаешь?

Andrey
24.08.2016
16:14:39
Да чтоб вам студенты о проделаной работе так отчитывались, как вы на вопросы отвечаете

Dan
24.08.2016
16:17:30
ты можешь просто ответить, где ты работаешь?
мне что-то подсказывает внутри, что название организации мало что скажет. это не яндекс, и даже не гугл.

пусть будет, например, Datalab Inc. )

ptchol
24.08.2016
16:21:36
Кста, разобрались в проблеме с flume )

ptchol
24.08.2016
16:54:19
перечитали логи, перекопали жиру, заглянули в исходники.

Flume попытался создать файлик, по каким то причинам машина в этот момент была перегружена. Взять лизу на namenode получилось, но при попытке приконнектится к дата нодам к 2м из 3х он получил отказ. Записал блок тока на одну ноду, потом побежал говорить об этом в нейм ноду, и попытался начать запись. В этот момент другой тред флюма обнаружил что файлик underreplicated и попытался закрыть его. На вызове close происходит fsync который также стучится в нейм ноды и фейлится после 4х попыток. В доке flume есть настроечка про ретраи закрытия в которой написано Number of times the sink must try renaming a file, after initiating a close attempt. If set to 1, this sink will not re-try a failed rename (due to, for example, NameNode or DataNode failure), and may leave the file in an open state with a .tmp extension. If set to 0, the sink will try to rename the file until the file is eventually renamed (there is no limit on the number of times it would try). The file may still remain open if the close call fails but the data will be intact and in this case, the file will be closed only after a Flume restart. В результате через 3 минуты, он ок ренеймит файл. Но походу close остается висеть. и рестарт флюма конечно не помогает

Konstantin
24.08.2016
17:03:38
чем открыть гиговый xml?

под виндой

Semyon
24.08.2016
17:04:09
можно vi поставить и открыть

Konstantin
24.08.2016
17:04:24
о, точняк

Pavel
24.08.2016
18:43:46
Konstantin
24.08.2016
18:44:32
он вроде не открывает большие

Pavel
24.08.2016
18:45:34
Да это, пожалуй, лучшее, что открывает большие файлы. Может и vi, но у них там своя секта.

Oleg
24.08.2016
18:52:09
Мне кажется проще обычным less открыть

Google
Oleg
24.08.2016
18:52:28
less вроде не грузит весь файл в память, в отличие от саблима и вима

Tom
24.08.2016
20:16:51
По статистике, если с 0, то: Гланц “Медико-биологическая статистика” и 2 курса на stepic.org

Савелий
24.08.2016
22:58:02
чем открыть гиговый xml?
если читать, то обычным фаром можно

Vladislav
25.08.2016
09:21:43
откуда столько народу и все занимаются big dataэой? о_0

Kirill
25.08.2016
09:23:39
Mikhail
25.08.2016
09:23:59
Кто то в комментах на хабре пропиарил

Danila
25.08.2016
09:24:20
толку то

Gonchik
25.08.2016
09:35:19
Пришел с хабра, интересно. Скиллов по аналитике пока нет, но хочется понять что к чему

Mikhail
25.08.2016
09:37:54
Кто где и как скилл прокачивает? Какие ресурсы, книги читаете и т.п.?

Страница 6 из 327