
Dima
09.07.2017
21:14:52
и экономика , и кодинг

Myst~Dyn (PL240) / Fhj (PL185) / Dynortice (PL130) ??
09.07.2017
21:15:43
Этим меня она и задела

Vladislav
10.07.2017
04:17:02
И еще, мало кому нужен такой человек, который в экселе может такое...

Google

Kate
10.07.2017
06:51:00

Vladislav
10.07.2017
06:51:44
Даже с VBA, у меня опыт его почти 15 лет

Constantine
10.07.2017
06:53:13


@Bv
10.07.2017
07:29:55
Всем привет, с AI, ML не знаком. Но есть желание научиться и есть подходящая, как я думаю, задача.
Сфера ЖКХ. Абоненты передают показания ИПУ, по разным каналам - email, сайт, телефон, смс, excel.
В половине случаев эта информация не соответствует ожидаемому шаблону. Мы парсим входные данные regexp, стараемся вытянуть то, что нам нужно. И, конечно, получается так себе. Много приходится перепроверять вручную.
Причем в подавляющем большинстве случаев человек сразу понимает, куда нужно загрузить показания.
Уже накоплена статистика вида - пришли такие-то данные, загружены туда-то. Т.е. есть образец правильных действий.
Вопросы к сообществу такие
1 Подходит ли ML-AI для решения такой задачи?
У меня сомнения, т.к. если будет ошибка, абоненту будет начислена не та сумма. А я такой руками развожу - ну, извини, тут искусственный интеллект :)
2 С чего конкретно лучше начать, чтобы эту задачу сделать? Какой метод выбрать? Есть ли best practice для такой задачи? Хочу делать на python
Спасибо!
Извините за длинную портянку


mrx
10.07.2017
07:32:00
как я вижу, тут необходим просто парсинг.
для ML тут задач нет)

Vladimir
10.07.2017
07:32:08
а задача то какая: с помощью ML парсить данные или что?

mrx
10.07.2017
07:32:59
я так понял, человек хочет ML определять что в шаблоне его data, а что просто строки

Vladimir
10.07.2017
07:33:01
вам бы ML, AI, Bigdata тут юзать с целью анализа работы систем по данным счетчиков + анализ поломок и тд и тп

Anton
10.07.2017
07:40:23
Задача для NER вроде

tonko
10.07.2017
07:40:32
+
Entity extraction
Для телефонных разговоров предварительно распознавалку речи

Google

mrx
10.07.2017
07:44:07

tonko
10.07.2017
07:47:41
Про какой шаблон речь?
Ребята, как я понял, и так с regex не справляются

Проксимов
10.07.2017
07:49:44
Я тутачки
Какой regex, где regex?

mrx
10.07.2017
07:50:17
я так понимаю у человека есть куча даты типа:
"горячая вода - 125, холодная вода - 85"
"14 - гв
18 - хв"
...
ему нужно вычленить значения

Проксимов
10.07.2017
07:50:38
Какой формат данных?

mrx
10.07.2017
07:51:17

@Bv
10.07.2017
08:20:02
в том то и дело, что формат не определен и скажем 10000 показаний удается загрузить, а еще 10 с какими-то проблемами, которые потом регулярками парсятся. Но остается часть, которую перепроверяют и заносят сотрудники. Они понимают, что Г1 10, это ГВС1 10 кубов.
Ну с regex тяжело да. Показаний не то что-бы много. Тысяч 20-25 ежемесячно. Но у людей фантазия хорошая, регекспами не очень получается.

Marat
10.07.2017
14:54:53
Друзья, одно время здесь в шапке была закреплена ссылка на гит хаб с литературой по AI/ML etc. поделитесь у кого осталась, пожалуйста)

Andrey
10.07.2017
14:58:54
https://github.com/demidovakatya/vvedenie-mashinnoe-obuchenie

Marat
10.07.2017
15:02:27
Спасибо)

Dan
10.07.2017
18:26:44

Paul
10.07.2017
18:27:13
Да, определенно сложно пройти мимо

Google

Konstantin
10.07.2017
18:27:35

Dima
10.07.2017
18:28:35
а кто в Украине machine learning заведует?

Dan
10.07.2017
18:32:17

Vitalii
10.07.2017
20:22:14

Konstantin
10.07.2017
20:24:20

Vladimir
10.07.2017
20:49:09
А вот Демидова Катя не постеснялась бы показать свой репозиторий всем! (сорри за оффтопик)

Konstantin
10.07.2017
21:05:23
Ну теперь ставьте тогда звездочки

Emil
10.07.2017
21:33:00
Хорошо

Николай
11.07.2017
11:42:17
А есть видео с Екатериной Демидовой?

Dan
11.07.2017
12:03:07

Timur
11.07.2017
12:17:28
rule34?

Николай
11.07.2017
12:17:42
Чета я на ютубе искал, не нашёл ?

Henadz
11.07.2017
12:17:55

Vitalii
11.07.2017
13:04:06

Николай
11.07.2017
16:12:25
https://m.youtube.com/watch?v=dCf9qyDHzeI

Dan
11.07.2017
16:23:12
почему?

Dima
11.07.2017
16:27:14

Admin
ERROR: S client not available

Tenni
11.07.2017
16:28:43
комменты под видео огонь

Google

Dima
11.07.2017
16:30:04
мда, почему-то комменты прохладные

Dan
11.07.2017
16:30:28
"у меня аж нейронная сеть зависла" это пять
?

Николай
11.07.2017
16:32:10
А у меня нейронная сеть поднялась

Tenni
11.07.2017
16:32:32
она же старая

Dima
11.07.2017
16:35:59
Milf

Dan
11.07.2017
16:41:02
http://www.rea.ru/ru/org/employees/Pages/Efremova-Natalija-Alekseevna.aspx
я восхищён

redbeard
11.07.2017
16:41:56
женюсь

Tenni
11.07.2017
16:42:28

Marperia
11.07.2017
16:42:55
Не старая, а опытная.

Dima
11.07.2017
16:43:39
чего-то ребят мы не туда побрели
может, лучше доклад обсудить


Dan
11.07.2017
16:45:41
Коллеги, попрошу минуточку вашего внимания.
У меня небольшая просьба. Мы (группа исследователей из ИТМО) тут наваяли небольшую анкету на тему того, что нужно знать специалисту по открытым данным (http://tiny.cc/ODSpec).
Эта тема довольно щекотливая, тк непонятно, стоит ли вообще выделять такого специалиста в отдельную категорию. Уже есть дата-саинтисты, статистики и так далее. Нужен ли отдельный спец по ОД?
Как мы уже выяснили, во-первых, есть спрос на комплект компетенций (умений и навыков) по работе с открытыми данными от не-IT-студентов и исследователей, а во-вторых, есть такая вакансия на западном рынке труда (мы пишем на эту тему статью, чуть позже с ней можно будет ознакомиться).
В общем, мы с коллегами решили составить опросник с общими вопросами о том, что же нужно знать и уметь специалисту по открытым данным?
Отдельно интересует вопрос знания английского языка (поэтому в анкете есть и вопросы по поводу английского языка).
В дальнейшем мы планируем сделать набор учебных курсов по работе с открытыми данными (планируется охватить все стадии работы с открытыми данными и управления данными, введение в программирование и тд). Курсы будут на двух языках (на русском и на английском). И ответы в этой анкете будут учитываться при разработке этих курсов.
Если вы также заинтересованы в разработке этих курсов, я готова обсудить сотрудничество (с большой радостью!).
А пока я прошу вас ответить на нашу анкету (http://tiny.cc/ODSpec). Она небольшая, на пару-тройку минут.


Dima
11.07.2017
16:46:56
а вы работаете в ИТМО?

Dan
11.07.2017
16:47:21
Лично я нет, но мои очень близкие знакомые люди там представлены весьма широко

Николай
11.07.2017
16:54:14
Dan, здесь написано о курсах, а какие-то курсы уже есть (по data science, machine learning)?

Dima
11.07.2017
16:54:58
Честно, говоря, кажется, что для работы с машинным обучением, биг дата программисты не сильно нужны, а нужны больше математики или люди, которые специалисты в этой области
Учитывая, как много инструментов для этого дела есть

Google

Mikhail
11.07.2017
16:55:54
нааачинается
только недавно эту тему мусолили
для работы с ML нужно желание
а не позиции и роли

Dan
11.07.2017
16:57:11

Dima
11.07.2017
16:58:19