@bigdata_ru

Страница 102 из 327
Dima
09.07.2017
21:14:52
и экономика , и кодинг

Myst~Dyn (PL240) / Fhj (PL185) / Dynortice (PL130) ??
09.07.2017
21:15:43
Этим меня она и задела

Vladislav
10.07.2017
04:17:02
И еще, мало кому нужен такой человек, который в экселе может такое...

Google
Kate
10.07.2017
06:51:00
Vladislav
10.07.2017
06:51:44
Даже с VBA, у меня опыт его почти 15 лет

Constantine
10.07.2017
06:53:13
ну как сказать... у меня есть один знакомый, который с многосотенмегабайтном экселевском файле умеет такое, что программист на питоне задумается и не сможет повторить такое же даже за месяц.
много писал на VBA и было большое желание переделать на java например (потому что хорошо интегрируется). IDE-шка застряла в 90-х, крайне неудобно

@Bv
10.07.2017
07:29:55
Всем привет, с AI, ML не знаком. Но есть желание научиться и есть подходящая, как я думаю, задача. Сфера ЖКХ. Абоненты передают показания ИПУ, по разным каналам - email, сайт, телефон, смс, excel. В половине случаев эта информация не соответствует ожидаемому шаблону. Мы парсим входные данные regexp, стараемся вытянуть то, что нам нужно. И, конечно, получается так себе. Много приходится перепроверять вручную. Причем в подавляющем большинстве случаев человек сразу понимает, куда нужно загрузить показания. Уже накоплена статистика вида - пришли такие-то данные, загружены туда-то. Т.е. есть образец правильных действий. Вопросы к сообществу такие 1 Подходит ли ML-AI для решения такой задачи? У меня сомнения, т.к. если будет ошибка, абоненту будет начислена не та сумма. А я такой руками развожу - ну, извини, тут искусственный интеллект :) 2 С чего конкретно лучше начать, чтобы эту задачу сделать? Какой метод выбрать? Есть ли best practice для такой задачи? Хочу делать на python Спасибо!

Извините за длинную портянку

mrx
10.07.2017
07:32:00
как я вижу, тут необходим просто парсинг. для ML тут задач нет)

Vladimir
10.07.2017
07:32:08
а задача то какая: с помощью ML парсить данные или что?

mrx
10.07.2017
07:32:59
я так понял, человек хочет ML определять что в шаблоне его data, а что просто строки

Vladimir
10.07.2017
07:33:01
вам бы ML, AI, Bigdata тут юзать с целью анализа работы систем по данным счетчиков + анализ поломок и тд и тп

Anton
10.07.2017
07:40:23
Задача для NER вроде

tonko
10.07.2017
07:40:32
+

Entity extraction

Для телефонных разговоров предварительно распознавалку речи

Google
mrx
10.07.2017
07:44:07
Задача для NER вроде
мне что-то подсказывает, что шаблон там проще.

tonko
10.07.2017
07:47:41
Про какой шаблон речь?

Ребята, как я понял, и так с regex не справляются

Проксимов
10.07.2017
07:49:44
Я тутачки

Какой regex, где regex?

mrx
10.07.2017
07:50:17
я так понимаю у человека есть куча даты типа: "горячая вода - 125, холодная вода - 85" "14 - гв 18 - хв" ... ему нужно вычленить значения

mrx
10.07.2017
07:51:17
Какой формат данных?
там выше бриф) я не заказчик))

@Bv
10.07.2017
08:20:02
в том то и дело, что формат не определен и скажем 10000 показаний удается загрузить, а еще 10 с какими-то проблемами, которые потом регулярками парсятся. Но остается часть, которую перепроверяют и заносят сотрудники. Они понимают, что Г1 10, это ГВС1 10 кубов.

Ну с regex тяжело да. Показаний не то что-бы много. Тысяч 20-25 ежемесячно. Но у людей фантазия хорошая, регекспами не очень получается.

Marat
10.07.2017
14:54:53
Друзья, одно время здесь в шапке была закреплена ссылка на гит хаб с литературой по AI/ML etc. поделитесь у кого осталась, пожалуйста)

Andrey
10.07.2017
14:58:54
https://github.com/demidovakatya/vvedenie-mashinnoe-obuchenie

Marat
10.07.2017
15:02:27
Спасибо)

Dan
10.07.2017
18:26:44
Paul
10.07.2017
18:27:13
Да, определенно сложно пройти мимо

Google
Dima
10.07.2017
18:28:35
а кто в Украине machine learning заведует?

Dan
10.07.2017
18:32:17
Тогда Я Сomputer Vision Татарии
Покажи свой репозиторий

Konstantin
10.07.2017
20:24:20
Vladimir
10.07.2017
20:49:09
А вот Демидова Катя не постеснялась бы показать свой репозиторий всем! (сорри за оффтопик)

Konstantin
10.07.2017
21:05:23
Ну теперь ставьте тогда звездочки

Emil
10.07.2017
21:33:00
Хорошо

Николай
11.07.2017
11:42:17
А есть видео с Екатериной Демидовой?

Dan
11.07.2017
12:03:07
А есть видео с Екатериной Демидовой?
Разумеется. В интернете есть вообще всё.

Timur
11.07.2017
12:17:28
rule34?

Николай
11.07.2017
12:17:42
Чета я на ютубе искал, не нашёл ?

Henadz
11.07.2017
12:17:55
Николай
11.07.2017
16:12:25
https://m.youtube.com/watch?v=dCf9qyDHzeI

Dan
11.07.2017
16:23:12
почему?

Dima
11.07.2017
16:27:14


Admin
ERROR: S client not available

Tenni
11.07.2017
16:28:43
комменты под видео огонь

Google
Dima
11.07.2017
16:30:04
мда, почему-то комменты прохладные

Dan
11.07.2017
16:30:28
"у меня аж нейронная сеть зависла" это пять

?

Николай
11.07.2017
16:32:10
А у меня нейронная сеть поднялась

Tenni
11.07.2017
16:32:32
она же старая

Dima
11.07.2017
16:35:59
Milf

Dan
11.07.2017
16:41:02
http://www.rea.ru/ru/org/employees/Pages/Efremova-Natalija-Alekseevna.aspx

я восхищён

redbeard
11.07.2017
16:41:56
женюсь

Tenni
11.07.2017
16:42:28
Marperia
11.07.2017
16:42:55
Не старая, а опытная.

Dima
11.07.2017
16:43:39
чего-то ребят мы не туда побрели

может, лучше доклад обсудить

Dan
11.07.2017
16:45:41
Коллеги, попрошу минуточку вашего внимания.

У меня небольшая просьба. Мы (группа исследователей из ИТМО) тут наваяли небольшую анкету на тему того, что нужно знать специалисту по открытым данным (http://tiny.cc/ODSpec). Эта тема довольно щекотливая, тк непонятно, стоит ли вообще выделять такого специалиста в отдельную категорию. Уже есть дата-саинтисты, статистики и так далее. Нужен ли отдельный спец по ОД? Как мы уже выяснили, во-первых, есть спрос на комплект компетенций (умений и навыков) по работе с открытыми данными от не-IT-студентов и исследователей, а во-вторых, есть такая вакансия на западном рынке труда (мы пишем на эту тему статью, чуть позже с ней можно будет ознакомиться). В общем, мы с коллегами решили составить опросник с общими вопросами о том, что же нужно знать и уметь специалисту по открытым данным? Отдельно интересует вопрос знания английского языка (поэтому в анкете есть и вопросы по поводу английского языка). В дальнейшем мы планируем сделать набор учебных курсов по работе с открытыми данными (планируется охватить все стадии работы с открытыми данными и управления данными, введение в программирование и тд). Курсы будут на двух языках (на русском и на английском). И ответы в этой анкете будут учитываться при разработке этих курсов. Если вы также заинтересованы в разработке этих курсов, я готова обсудить сотрудничество (с большой радостью!). А пока я прошу вас ответить на нашу анкету (http://tiny.cc/ODSpec). Она небольшая, на пару-тройку минут.

Dima
11.07.2017
16:46:56
а вы работаете в ИТМО?

Dan
11.07.2017
16:47:21
Лично я нет, но мои очень близкие знакомые люди там представлены весьма широко

Николай
11.07.2017
16:54:14
Dan, здесь написано о курсах, а какие-то курсы уже есть (по data science, machine learning)?

Dima
11.07.2017
16:54:58
Честно, говоря, кажется, что для работы с машинным обучением, биг дата программисты не сильно нужны, а нужны больше математики или люди, которые специалисты в этой области

Учитывая, как много инструментов для этого дела есть

Google
Mikhail
11.07.2017
16:55:54
нааачинается

только недавно эту тему мусолили

для работы с ML нужно желание

а не позиции и роли

Dan
11.07.2017
16:57:11
Dima
11.07.2017
16:58:19

Страница 102 из 327