
.
03.07.2018
06:56:17

Sam
03.07.2018
07:02:45
Sorry for that ,I needed info on HQL which is again part of big data , since I was not able to get in HQL ,I was trying sql then I can relate

Oleg
03.07.2018
08:16:43
Добрый день,
Есть-ли у кого опыт работы с различными линейными оптимизаторами? Мне интересны сравнения производительности, матрица примерно (64784 rows, 516288 columns), оптимизируется 9 часов, что никак не подходит.
Пробовал на питоне glpk.ilp, cvxopt.solvers.lp. Почему-то ilp работает только на одном ядре.

Саня
04.07.2018
17:26:02
Все привет! У кого-нибудь есть опыт с cplex/gurobi/express? Много ли знаний требуется чтобы с их помощью решать целочисленные задачи? или хватит общего понимания что такое оптимизация?

Google

Никита
06.07.2018
15:57:55
Привет, можете посоветовать что-то из практических курсов и\или статей по МЛ в питоне? базовые принципы я почерпнул, теперь хочу закреплять на практике

Roman
06.07.2018
16:26:53

Kate
06.07.2018
19:00:25
Привет)?
Посоветуйте литерптуры, курсы, статьи , где можно почитать о анализе изображений

Dmitry
06.07.2018
23:15:58

Паша
07.07.2018
02:29:05

Kate
07.07.2018
05:01:27

Max
07.07.2018
08:35:06
Привет. Есть задача поступающие логи группировать по типам сообщений и заодно показывать анормальные события. Для интереса хочется решить эту задачу на нейронных сетях. Подскажите какие ключевые слова погуглить для этих двух тасков

undiabler
07.07.2018
08:38:42
А что подразумевается под аномалиями? Аномальные показатели? Ошибки?

Max
07.07.2018
08:39:38
Ошибки, логов много и хочется выделять несвойственные записи которые возникают

undiabler
07.07.2018
08:45:14
Ну это очень плохой пример для нейронных сетей) можно решать как задача классификации, сверточными сетями. Но если без учителя учить то на каждый не типичный лог ( даже не ошибки ) будет тригерить. Но даже в этом случае данные нужно предварительно либо подготовить, либо какую-то нормализацию придумать для текста. Короче имхо микроскопом по гвоздям =)

Max
07.07.2018
08:47:30
С учителем не получится ТК типов логов куча и постоянно новые логи создаются ТК приложения развиваются.
Буду тогда вообще и через метрики делать по старинке :)

Dan
07.07.2018
17:03:02
@rpilyushin у нас не хантят :)

Google

Dan
07.07.2018
17:03:20
Но я могу подсказать где можно попробовать поискать себе людей и покидать вакансии

Roman
07.07.2018
17:04:02

Dan
07.07.2018
17:05:06
Окей, спасибо
github.com/goq/telegram-list - там есть разделы с каналами и группами, где не просто можно, а даже нужно отправлять вакансии. Только есть определённые правила, обычно требуется указывать не только требования, но и вилку предлагаемых salary :)
Удачи в поисках

Roman
07.07.2018
17:06:24
Окей, спасибо

Анна
09.07.2018
06:12:15
Доброго времени. Подскажите, плиз, что почитать/посмотреть по вопросу прогнозирование отказа оборудования на производстве?

Seva
09.07.2018
06:16:33
Ещё бы попробовал кластеризовать. Наверняка, одинаковые ошибки имеют общий префикс
Или можно выделить несколько классов типичных ошибок, забить их ручками, и смотреть на аутсайдеров
Я предполагаю, что сами ошибки легко выделить каким-нибудь грепом a la ^E

Yury
09.07.2018
06:32:43
Можно ли в чате публиковать вакансии data scientist'ов ?

Alena
09.07.2018
06:37:05

Никита
09.07.2018
07:14:34
Что есть из ресурсов с разжевыванием материала и практикой? На курс эра нашёл несколько курсов, но пока хочу что-то бесплатно попробовать

Max
09.07.2018
08:13:31

Seva
09.07.2018
08:14:03
Значит, ручками надо

Max
09.07.2018
08:14:42

Seva
09.07.2018
08:14:50
Я почему-то уверен, что первые 10 самых частых типов ошибок покрывают 90%

Evgeniy
09.07.2018
08:15:06

Max
09.07.2018
08:15:21

Seva
09.07.2018
08:15:54
А где там была история про победителя яндекса, который все в экселе порешал?

Google

Max
09.07.2018
08:16:25

Seva
09.07.2018
08:17:00
Так, ты ведь просто сами ошибки умеешь ловить?
В каком-нибудь glog они идут с префиксом E<date>
Если да, и ты умеешь ловить типичные, ты можешь ловить и разность этих множеств

Admin
ERROR: S client not available

Max
09.07.2018
08:18:09
Да ошибки все в еластик серч лежат

Seva
09.07.2018
08:21:51
А, так понятнее, а то я из общих соображений
Попробуй кластеризацию, надо только метрику хорошую придумать
Может побить на биграммы, а потом смотреть сколько есть общих в мультисете? Не метрика, но на этом, наверное,
Можно построить что-нибудь интересное

Max
09.07.2018
08:26:48
А кластеризации можно сделать разбиение по классам когда их кол-во неизвестно?

Seva
09.07.2018
08:27:17
DBSCAN

Max
09.07.2018
08:28:33
Ок, поизучаю. Спасибо

alex
09.07.2018
10:21:20

Max
09.07.2018
10:28:50
Кол-во классов постоянно меняется
У нас около сотни микросервисов и они постоянно меняются
И добавляются новые

W
09.07.2018
11:35:52
Привет, может кто-то знает канал куда можно опубликовать предложение о работе над проектом( разработке системы рекомендаций) в области ML? В списке каналов не нашел ( а может просмотрел) ничего подходящего

Dan
09.07.2018
11:36:49

Google

Alex
09.07.2018
18:19:14
Коллеги, помогите с одной штукой в pandas
Есть dataframe, в качестве индекса date-time series типа "2007-07-03 09:30:00". Так же есть список дней (вида "2008-01-01"), которые нужно выкинуть из имеющегося dataframe.
Я писал похожую штуку в R и там это делается буквально одной строчкой
data_frame = data_frame[!date(index(data_frame)) %in% date_list, ]

Mike
09.07.2018
18:40:15

Alex
09.07.2018
18:43:00

Никита
10.07.2018
03:20:17
Можете посоветовать курсы по мл для начинающих? Пока нашёл от яндекса, но хочу для начала бесплатное что-то попробовать