@bigdata_ru

Страница 285 из 327

.

03.07.2018
06:56:17

I got one query on top of this , please help

Please try solve your problems by yourself, we can't help you with non-thematically stuff. This chat is called AI/Big Data/ML, so we have nothing to do with your SQL-problems.

Sam

03.07.2018
07:02:45

Sorry for that ,I needed info on HQL which is again part of big data , since I was not able to get in HQL ,I was trying sql then I can relate

Oleg

03.07.2018
08:16:43

Добрый день, Есть-ли у кого опыт работы с различными линейными оптимизаторами? Мне интересны сравнения производительности, матрица примерно (64784 rows, 516288 columns), оптимизируется 9 часов, что никак не подходит. Пробовал на питоне glpk.ilp, cvxopt.solvers.lp. Почему-то ilp работает только на одном ядре.

Саня

04.07.2018
17:26:02

Все привет! У кого-нибудь есть опыт с cplex/gurobi/express? Много ли знаний требуется чтобы с их помощью решать целочисленные задачи? или хватит общего понимания что такое оптимизация?

Google

Никита

06.07.2018
15:57:55

Привет, можете посоветовать что-то из практических курсов и\или статей по МЛ в питоне? базовые принципы я почерпнул, теперь хочу закреплять на практике

Roman

06.07.2018
16:26:53

Привет, можете посоветовать что-то из практических курсов и\или статей по МЛ в питоне? базовые принципы я почерпнул, теперь хочу закреплять на практике

На Курсере от ВШЭ отличный курс

Kate

06.07.2018
19:00:25

Привет)? Посоветуйте литерптуры, курсы, статьи , где можно почитать о анализе изображений

Dmitry

06.07.2018
23:15:58

Привет)? Посоветуйте литерптуры, курсы, статьи , где можно почитать о анализе изображений

Документация и туториалы по OpenCV

Паша

07.07.2018
02:29:05

Привет)? Посоветуйте литерптуры, курсы, статьи , где можно почитать о анализе изображений

Привет, недавно наткнулся, но сам еще не читал: https://vk.com/wall-94208167_2053

Kate

07.07.2018
05:01:27

Привет, недавно наткнулся, но сам еще не читал: https://vk.com/wall-94208167_2053

Оу, спасибо . обширная подборка

Max

07.07.2018
08:35:06

Привет. Есть задача поступающие логи группировать по типам сообщений и заодно показывать анормальные события. Для интереса хочется решить эту задачу на нейронных сетях. Подскажите какие ключевые слова погуглить для этих двух тасков

undiabler

07.07.2018
08:38:42

А что подразумевается под аномалиями? Аномальные показатели? Ошибки?

Max

07.07.2018
08:39:38

Ошибки, логов много и хочется выделять несвойственные записи которые возникают

undiabler

07.07.2018
08:45:14

Ну это очень плохой пример для нейронных сетей) можно решать как задача классификации, сверточными сетями. Но если без учителя учить то на каждый не типичный лог ( даже не ошибки ) будет тригерить. Но даже в этом случае данные нужно предварительно либо подготовить, либо какую-то нормализацию придумать для текста. Короче имхо микроскопом по гвоздям =)

Max

07.07.2018
08:47:30

С учителем не получится ТК типов логов куча и постоянно новые логи создаются ТК приложения развиваются.

Буду тогда вообще и через метрики делать по старинке :)

Dan

07.07.2018
17:03:02

@rpilyushin у нас не хантят :)

Google

Dan

07.07.2018
17:03:20

Но я могу подсказать где можно попробовать поискать себе людей и покидать вакансии

Roman

07.07.2018
17:04:02

Но я могу подсказать где можно попробовать поискать себе людей и покидать вакансии

Окей, спасибо

Dan

07.07.2018
17:05:06

Окей, спасибо

github.com/goq/telegram-list - там есть разделы с каналами и группами, где не просто можно, а даже нужно отправлять вакансии. Только есть определённые правила, обычно требуется указывать не только требования, но и вилку предлагаемых salary :)

Удачи в поисках

Roman

07.07.2018
17:06:24

Окей, спасибо

Анна

09.07.2018
06:12:15

Доброго времени. Подскажите, плиз, что почитать/посмотреть по вопросу прогнозирование отказа оборудования на производстве?

Seva

09.07.2018
06:16:33

Ошибки, логов много и хочется выделять несвойственные записи которые возникают

Может какие-нибудь картинки нарисовать? Я бы для начала просто на оси времени их отметил

Ещё бы попробовал кластеризовать. Наверняка, одинаковые ошибки имеют общий префикс

Или можно выделить несколько классов типичных ошибок, забить их ручками, и смотреть на аутсайдеров

Я предполагаю, что сами ошибки легко выделить каким-нибудь грепом a la ^E

Yury

09.07.2018
06:32:43

Можно ли в чате публиковать вакансии data scientist'ов ?

Alena

09.07.2018
06:37:05

Можно ли в чате публиковать вакансии data scientist'ов ?

Если пролистать чуть выше, то увидите, что нет. И будет дана ссылка на каналы, где можно и нужно

Никита

09.07.2018
07:14:34

Что есть из ресурсов с разжевыванием материала и практикой? На курс эра нашёл несколько курсов, но пока хочу что-то бесплатно попробовать

Max

09.07.2018
08:13:31

Может какие-нибудь картинки нарисовать? Я бы для начала просто на оси времени их отметил

Это уже делается в кибане и так. Но там нет группировки по ошибкам

Seva

09.07.2018
08:14:03

Значит, ручками надо

Max

09.07.2018
08:14:42

Или можно выделить несколько классов типичных ошибок, забить их ручками, и смотреть на аутсайдеров

Ошибок много, у каждого микросервиса свои и много сервисов. Плюс код меняется постоянно и что то удаляется а что то добавляется

Seva

09.07.2018
08:14:50

Я почему-то уверен, что первые 10 самых частых типов ошибок покрывают 90%

Evgeniy

09.07.2018
08:15:06

Значит, ручками надо

ты чо, а как же мошинлернинг

Max

09.07.2018
08:15:21

ты чо, а как же мошинлернинг

Во во :)

Seva

09.07.2018
08:15:54

А где там была история про победителя яндекса, который все в экселе порешал?

Google

Max

09.07.2018
08:16:25

Я почему-то уверен, что первые 10 самых частых типов ошибок покрывают 90%

Это так но это стандартные ожидаемые ошибки. А хочется ловить как раз ошибки которые пролетают мимо в большом количестве стандартных

Seva

09.07.2018
08:17:00

Так, ты ведь просто сами ошибки умеешь ловить?

В каком-нибудь glog они идут с префиксом E<date>

Если да, и ты умеешь ловить типичные, ты можешь ловить и разность этих множеств

Admin

ERROR: S client not available

Max

09.07.2018
08:18:09

Да ошибки все в еластик серч лежат

Если да, и ты умеешь ловить типичные, ты можешь ловить и разность этих множеств

Оно понятно что можно по логеру и error message в лоб строить статистику и подсвечивать необычные плюс если есть резкий рост. Но мне хотелось потрогать МЛ в боевых условиях и подумал что попробовать на этом задании :)

Seva

09.07.2018
08:21:51

А, так понятнее, а то я из общих соображений

Попробуй кластеризацию, надо только метрику хорошую придумать

Может побить на биграммы, а потом смотреть сколько есть общих в мультисете? Не метрика, но на этом, наверное,

Можно построить что-нибудь интересное

Max

09.07.2018
08:26:48

А кластеризации можно сделать разбиение по классам когда их кол-во неизвестно?

Seva

09.07.2018
08:27:17

DBSCAN

Max

09.07.2018
08:28:33

Ок, поизучаю. Спасибо

alex

09.07.2018
10:21:20

А кластеризации можно сделать разбиение по классам когда их кол-во неизвестно?

Можно сделать перебор по количеству классов с подсчетом метрик качества кластеризации

Max

09.07.2018
10:28:50

Кол-во классов постоянно меняется

У нас около сотни микросервисов и они постоянно меняются

И добавляются новые

W

09.07.2018
11:35:52

Привет, может кто-то знает канал куда можно опубликовать предложение о работе над проектом( разработке системы рекомендаций) в области ML? В списке каналов не нашел ( а может просмотрел) ничего подходящего

Dan

09.07.2018
11:36:49

Привет, может кто-то знает канал куда можно опубликовать предложение о работе над проектом( разработке системы рекомендаций) в области ML? В списке каналов не нашел ( а может просмотрел) ничего подходящего

Я же писал уже тебе в лс, есть github.com/goq/telegram-list Или вот, например, группа, где можно вакансии размещать: https://t.me/myjobit

Google

Alex

09.07.2018
18:19:14

Коллеги, помогите с одной штукой в pandas Есть dataframe, в качестве индекса date-time series типа "2007-07-03 09:30:00". Так же есть список дней (вида "2008-01-01"), которые нужно выкинуть из имеющегося dataframe. Я писал похожую штуку в R и там это делается буквально одной строчкой data_frame = data_frame[!date(index(data_frame)) %in% date_list, ]

Mike

09.07.2018
18:40:15

Коллеги, помогите с одной штукой в pandas Есть dataframe, в качестве индекса date-time series типа "2007-07-03 09:30:00". Так же есть список дней (вида "2008-01-01"), которые нужно выкинуть из имеющегося dataframe. Я писал похожую штуку в R и там это делается буквально одной строчкой data_frame = data_frame[!date(index(data_frame)) %in% date_list, ]

В чем вопрос

Alex

09.07.2018
18:43:00

В чем вопрос

как удалить лишние дни из dataframe

Никита

10.07.2018
03:20:17

Можете посоветовать курсы по мл для начинающих? Пока нашёл от яндекса, но хочу для начала бесплатное что-то попробовать

« Назад

Страница 285 из 327

Далее »

Открыть в Telegram