@bigdata_ru

Страница 285 из 327
.
03.07.2018
06:56:17
I got one query on top of this , please help
Please try solve your problems by yourself, we can't help you with non-thematically stuff. This chat is called AI/Big Data/ML, so we have nothing to do with your SQL-problems.

Sam
03.07.2018
07:02:45
Sorry for that ,I needed info on HQL which is again part of big data , since I was not able to get in HQL ,I was trying sql then I can relate

Oleg
03.07.2018
08:16:43
Добрый день, Есть-ли у кого опыт работы с различными линейными оптимизаторами? Мне интересны сравнения производительности, матрица примерно (64784 rows, 516288 columns), оптимизируется 9 часов, что никак не подходит. Пробовал на питоне glpk.ilp, cvxopt.solvers.lp. Почему-то ilp работает только на одном ядре.

Саня
04.07.2018
17:26:02
Все привет! У кого-нибудь есть опыт с cplex/gurobi/express? Много ли знаний требуется чтобы с их помощью решать целочисленные задачи? или хватит общего понимания что такое оптимизация?

Google
Никита
06.07.2018
15:57:55
Привет, можете посоветовать что-то из практических курсов и\или статей по МЛ в питоне? базовые принципы я почерпнул, теперь хочу закреплять на практике

Kate
06.07.2018
19:00:25
Привет)? Посоветуйте литерптуры, курсы, статьи , где можно почитать о анализе изображений

Паша
07.07.2018
02:29:05
Привет)? Посоветуйте литерптуры, курсы, статьи , где можно почитать о анализе изображений
Привет, недавно наткнулся, но сам еще не читал: https://vk.com/wall-94208167_2053

Kate
07.07.2018
05:01:27
Max
07.07.2018
08:35:06
Привет. Есть задача поступающие логи группировать по типам сообщений и заодно показывать анормальные события. Для интереса хочется решить эту задачу на нейронных сетях. Подскажите какие ключевые слова погуглить для этих двух тасков

undiabler
07.07.2018
08:38:42
А что подразумевается под аномалиями? Аномальные показатели? Ошибки?

Max
07.07.2018
08:39:38
Ошибки, логов много и хочется выделять несвойственные записи которые возникают

undiabler
07.07.2018
08:45:14
Ну это очень плохой пример для нейронных сетей) можно решать как задача классификации, сверточными сетями. Но если без учителя учить то на каждый не типичный лог ( даже не ошибки ) будет тригерить. Но даже в этом случае данные нужно предварительно либо подготовить, либо какую-то нормализацию придумать для текста. Короче имхо микроскопом по гвоздям =)

Max
07.07.2018
08:47:30
С учителем не получится ТК типов логов куча и постоянно новые логи создаются ТК приложения развиваются.

Буду тогда вообще и через метрики делать по старинке :)

Dan
07.07.2018
17:03:02
@rpilyushin у нас не хантят :)

Google
Dan
07.07.2018
17:03:20
Но я могу подсказать где можно попробовать поискать себе людей и покидать вакансии

Dan
07.07.2018
17:05:06
Окей, спасибо
github.com/goq/telegram-list - там есть разделы с каналами и группами, где не просто можно, а даже нужно отправлять вакансии. Только есть определённые правила, обычно требуется указывать не только требования, но и вилку предлагаемых salary :)

Удачи в поисках

Roman
07.07.2018
17:06:24
Окей, спасибо

Анна
09.07.2018
06:12:15
Доброго времени. Подскажите, плиз, что почитать/посмотреть по вопросу прогнозирование отказа оборудования на производстве?

Seva
09.07.2018
06:16:33
Ошибки, логов много и хочется выделять несвойственные записи которые возникают
Может какие-нибудь картинки нарисовать? Я бы для начала просто на оси времени их отметил

Ещё бы попробовал кластеризовать. Наверняка, одинаковые ошибки имеют общий префикс

Или можно выделить несколько классов типичных ошибок, забить их ручками, и смотреть на аутсайдеров

Я предполагаю, что сами ошибки легко выделить каким-нибудь грепом a la ^E

Yury
09.07.2018
06:32:43
Можно ли в чате публиковать вакансии data scientist'ов ?

Alena
09.07.2018
06:37:05
Можно ли в чате публиковать вакансии data scientist'ов ?
Если пролистать чуть выше, то увидите, что нет. И будет дана ссылка на каналы, где можно и нужно

Никита
09.07.2018
07:14:34
Что есть из ресурсов с разжевыванием материала и практикой? На курс эра нашёл несколько курсов, но пока хочу что-то бесплатно попробовать

Max
09.07.2018
08:13:31
Может какие-нибудь картинки нарисовать? Я бы для начала просто на оси времени их отметил
Это уже делается в кибане и так. Но там нет группировки по ошибкам

Seva
09.07.2018
08:14:03
Значит, ручками надо

Max
09.07.2018
08:14:42
Или можно выделить несколько классов типичных ошибок, забить их ручками, и смотреть на аутсайдеров
Ошибок много, у каждого микросервиса свои и много сервисов. Плюс код меняется постоянно и что то удаляется а что то добавляется

Seva
09.07.2018
08:14:50
Я почему-то уверен, что первые 10 самых частых типов ошибок покрывают 90%

Evgeniy
09.07.2018
08:15:06
Значит, ручками надо
ты чо, а как же мошинлернинг

Max
09.07.2018
08:15:21
Seva
09.07.2018
08:15:54
А где там была история про победителя яндекса, который все в экселе порешал?

Google
Max
09.07.2018
08:16:25
Я почему-то уверен, что первые 10 самых частых типов ошибок покрывают 90%
Это так но это стандартные ожидаемые ошибки. А хочется ловить как раз ошибки которые пролетают мимо в большом количестве стандартных

Seva
09.07.2018
08:17:00
Так, ты ведь просто сами ошибки умеешь ловить?

В каком-нибудь glog они идут с префиксом E<date>

Если да, и ты умеешь ловить типичные, ты можешь ловить и разность этих множеств

Admin
ERROR: S client not available

Max
09.07.2018
08:18:09
Да ошибки все в еластик серч лежат

Если да, и ты умеешь ловить типичные, ты можешь ловить и разность этих множеств
Оно понятно что можно по логеру и error message в лоб строить статистику и подсвечивать необычные плюс если есть резкий рост. Но мне хотелось потрогать МЛ в боевых условиях и подумал что попробовать на этом задании :)

Seva
09.07.2018
08:21:51
А, так понятнее, а то я из общих соображений

Попробуй кластеризацию, надо только метрику хорошую придумать

Может побить на биграммы, а потом смотреть сколько есть общих в мультисете? Не метрика, но на этом, наверное,

Можно построить что-нибудь интересное

Max
09.07.2018
08:26:48
А кластеризации можно сделать разбиение по классам когда их кол-во неизвестно?

Seva
09.07.2018
08:27:17
DBSCAN

Max
09.07.2018
08:28:33
Ок, поизучаю. Спасибо

alex
09.07.2018
10:21:20
А кластеризации можно сделать разбиение по классам когда их кол-во неизвестно?
Можно сделать перебор по количеству классов с подсчетом метрик качества кластеризации

Max
09.07.2018
10:28:50
Кол-во классов постоянно меняется

У нас около сотни микросервисов и они постоянно меняются

И добавляются новые

W
09.07.2018
11:35:52
Привет, может кто-то знает канал куда можно опубликовать предложение о работе над проектом( разработке системы рекомендаций) в области ML? В списке каналов не нашел ( а может просмотрел) ничего подходящего

Google
Alex
09.07.2018
18:19:14
Коллеги, помогите с одной штукой в pandas Есть dataframe, в качестве индекса date-time series типа "2007-07-03 09:30:00". Так же есть список дней (вида "2008-01-01"), которые нужно выкинуть из имеющегося dataframe. Я писал похожую штуку в R и там это делается буквально одной строчкой data_frame = data_frame[!date(index(data_frame)) %in% date_list, ]

Alex
09.07.2018
18:43:00
В чем вопрос
как удалить лишние дни из dataframe

Никита
10.07.2018
03:20:17
Можете посоветовать курсы по мл для начинающих? Пока нашёл от яндекса, но хочу для начала бесплатное что-то попробовать

Страница 285 из 327