
Dan
21.08.2017
18:54:32

Проксимов
21.08.2017
18:55:07
Эй

Artem
21.08.2017
18:55:13
Обычно флуд бывает в маленьких чатах где все друг-друга знают, а в больших изредка пару сообщений проскакивает

Google

tonko
21.08.2017
18:55:17
и вот для визуального восприятия https://ronxin.github.io/wevi/

Проксимов
21.08.2017
18:55:39

Sergey
21.08.2017
18:56:16

Artem
21.08.2017
18:56:36

Dan
21.08.2017
18:56:48
Эй
да, бот жёсткий тут, зато никакого спама нет ?
но да, @ru_python это вообще жесть

Artem
21.08.2017
19:00:25
А чего нет? Разве что не так много людей начинает программировать с изучения МЛ

tonko
21.08.2017
19:02:44
большинство же по списку-it каналов приходит . Я сразу в три релейтед канала зашел.

Artem
21.08.2017
19:03:19
И одни молчуны тут сидят

Sergey
21.08.2017
19:03:24

Tenni
21.08.2017
19:06:42
у нас в убунте норм
даже HR нету

Google

Dan
21.08.2017
19:06:55
потому что ссылки забанены от хх.ру
?

Tenni
21.08.2017
19:07:28
?

Sergey
21.08.2017
19:07:44
как можно сравнивать сообщество JS и AL/ML ??
а что, в сообществе AL/ML не люди? в любом чате, люди учат что-то, задают вопросы, деляться знаниями, обсуждают что-то развиваться, я не так давно начал интересоваться машинным обучением, еще не знаю как должен себя вести AL/ML человек, но может я ошибась, и в AL/ML нельзя не чего обсуждать, точнее сложно, и нужно только самостоятельно сидеть - книжки читать

Artem
21.08.2017
19:08:38
Ну книжки читать и гуглить в любом случае быстрее чем в чатах спрашивать


Dan
21.08.2017
19:08:41
а что, в сообществе AL/ML не люди? в любом чате, люди учат что-то, задают вопросы, деляться знаниями, обсуждают что-то развиваться, я не так давно начал интересоваться машинным обучением, еще не знаю как должен себя вести AL/ML человек, но может я ошибась, и в AL/ML нельзя не чего обсуждать, точнее сложно, и нужно только самостоятельно сидеть - книжки читать
Так это же прекрасно! Этот чат именно для этого и был создан, чтобы объединить интересующихся тематикой, и делиться интересными мыслями, ссылками, книгами, информацией и так далее! ?
Есть вещи, которые в чатах хорошо обсуждать. А вот ждать что чат за тебя что-то делать будет - так себе идейка.
а что, в сообществе AL/ML не люди? в любом чате, люди учат что-то, задают вопросы, деляться знаниями, обсуждают что-то развиваться, я не так давно начал интересоваться машинным обучением, еще не знаю как должен себя вести AL/ML человек, но может я ошибась, и в AL/ML нельзя не чего обсуждать, точнее сложно, и нужно только самостоятельно сидеть - книжки читать
Вот вам для изучения: https://github.com/demidovakatya/vvedenie-mashinnoe-obuchenie
это самый полезный репо из того что я видел
и есть еще список хороших книг по теме


Artem
21.08.2017
19:10:06
А что такое AL вообще?

Dan
21.08.2017
19:10:28
https://ru.stackoverflow.com/a/683632/1084

Artem
21.08.2017
19:10:54
Так это AI, а не AL :)

Artem
21.08.2017
19:11:12
Это опечатка, наверное)

Sergey
21.08.2017
19:11:21

Dan
21.08.2017
19:12:02
Ха, да, простите, опечатался

Oleksandr
21.08.2017
19:12:16
а гугл вообще форсит аббревиатуру mi — machine intelligence

Dan
21.08.2017
19:12:17
конечно AI / ML - просто рядом ж

Google

Sergey
21.08.2017
19:13:02

Dan
21.08.2017
19:14:39

Artem
21.08.2017
19:16:44
А в их слаке спрашивали?

Dan
21.08.2017
19:17:53
Их это кого? у нас в РФ про Timescale DB знают 12 человек. 8 из которых живут не в России, двое - это мы, а еще двое - хорошие знакомые, которые тоже ищут информацию на эту тему.

Sergey
21.08.2017
19:18:05
Эх, золотые слова! Нам всем иногда нужен "пинок под зад" в нужном направлении. Просто не всегда могут помочь. Я вот уже 3 недели безуспешно пытаюсь найти человека, который уже работал с Timescale DB и может наглядно продемонстрировать подводные камни и особенности реализации. готовы интервью взять. Но нет - хоть сам садись и ковыряй ?
так, этож зам замечательно! только нужно не в тихаря самостоятельно учить, а обсуждать это с сообществом, даже если кто-то не знает, может просто заинтересуеться и будете разбираться вместе, а две головы уже лучше, и другие будут больше знать про эту тему, я просто хочу чтоб в этом сообществе было больше активити, а то совсем печальная ситуация тут (

Artem
21.08.2017
19:18:44

Dan
21.08.2017
19:19:31

Taras ?
21.08.2017
19:30:45

Dan
21.08.2017
19:31:07
сейчас мегахайп вокруг time based db, их много и они разные
в том числе для сбора огромного количества данных - это очень хорошее решение, т.к. позволяет отталкиваться именно от времени записи

Artem
21.08.2017
19:32:14
Интересно когда начнется хайп вокруг графовых бд

Dan
21.08.2017
19:32:40
хы! а он чуть больше чем у time based.

Taras ?
21.08.2017
19:33:30

Dan
21.08.2017
19:35:19
просто сейчас например Gnocchi для openstack использует time series storage, как и в Ceilometer. и их методы реализации мне очень понравились с точки зрения сбора и хранения данных. например при том же безумном мегапарсинге с последующей нормализацией - нужно будет делать бешеные выборки, и time series в этом сильно помогают
т.е. они взяли pgsql, скрестили её с вот чем-то интересным и получили SQL но на time series

Lepus
21.08.2017
19:45:50

Kaspar
21.08.2017
19:47:02
таймсирис идеально для логов, метрик. Потока евентов. При бигдате и хранении результата парсинга какой профит? Хранить где-то еще некий индекс когда и что мы туда положили?

Dan
21.08.2017
19:52:14

Google

Kaspar
21.08.2017
20:13:58
так совпало что смотрю видео сейчас с Олегом Бартуновым о том, как они в постгрес впилили полнотекстовый поиск
нравятся его доклады, он еще на шамана похож, может видели

Admin
ERROR: S client not available

Kaspar
21.08.2017
20:14:32
https://www.youtube.com/watch?v=9jRxz31xDZc

Dan
21.08.2017
20:55:46
пока мы pgsql и используем для наших задач кстати, и в коммьюнити багрепорты шлём эпизодически

Andrey
22.08.2017
03:40:57
А учеба в чатике - такой же миф, как копание ямы в чатике или ремонт автомобиля в чатике.
Давайте наброшу для повышения активности. Сделал обзор http://biostat-r.blogspot.in/2017/07/r.html?m=1. Кто чем пользуется из списка?

Ivan
22.08.2017
04:31:27
А что потом делать с R кодом?
питон можно засунуть в продакшн

Andrey
22.08.2017
04:47:10
А R нельзя?

Ivan
22.08.2017
04:47:35
без понятия, поэтому и интересуюсь
так-то R очевидно тащит за собой свой рантайм, не очевидно, умеет ли оно dlib и opencv
поверхностный гуглинг дал пару-тройку портов известных либ под R, но контрибуторов там 1-2 человека

Andrey
22.08.2017
04:51:54
В R можно заюзать практически любую библиотеку на любом языке. H2O тому пример в случае джавы, Rcpp - C++, reticulate - python
Портировать ничего не нужно. TF и Keras работают даже!
Глянь кернелы https://www.kaggle.com/c/invasive-species-monitoring, там про 0.99 - мой на R

Ivan
22.08.2017
04:55:07
мхм, хорошо. А какие преимущества у R перед питоном?

Andrey
22.08.2017
04:55:50
Я его лучше знаю. Это считается?

Google

Andrey
22.08.2017
04:57:07
С учетом возможности дергать R из питона и питон из R абстрактно сравнивать стало невозможно

Ivan
22.08.2017
04:57:16
думаю, да. Отличный аргумент в пользу "интерактивная среда для экспериментов, аналог матлаба. Все сразу и наглядно, окошко графиков рядом"

Andrey
22.08.2017
04:58:08
Но по опыту использования - ggplot2 лучше matplotlib, data.table и dplyr лучше pandas
Shiny вообще рулит и решает, статистические тесты - тоже

Ivan
22.08.2017
04:59:00
так это программистам лучше. Новичкам с научным бэкграундом проще в R, нет?

Anton
22.08.2017
04:59:23

Andrey
22.08.2017
05:01:44

Vova
22.08.2017
08:46:43

Dan
22.08.2017
08:49:10
имхо преимущества очевидны. Но если не очевидны, то значит я зря вопрос поднимал.
так не пойдёт. все люди разные, и у всех разные взгляды на самые разнообразные процессы. для меня, например, процесс слияния чата Data Science с нашим не очевиден, и преимущества тоже. скорее всего потому что я об этом не думал никогда ранее в силу занятости другими, более приоритетными делами. поэтому я и прошу вас обосновать свою точку зрения преимуществами.
а вот говорить: "это же очевидно. а если не очевидно - то зря" это как-то не по-мужски ?


Vova
22.08.2017
08:54:32
так не пойдёт. все люди разные, и у всех разные взгляды на самые разнообразные процессы. для меня, например, процесс слияния чата Data Science с нашим не очевиден, и преимущества тоже. скорее всего потому что я об этом не думал никогда ранее в силу занятости другими, более приоритетными делами. поэтому я и прошу вас обосновать свою точку зрения преимуществами.
ок, сообщества пересекаются лишь частично (на глаз), значит можно ожидать ~удвоения численности. Это усилит дискуссию (возможно квадратично). Сужу по примеру 2х чатов (C#, Python), переход цифры 3000 - уже бурное и непрерывное обсуждение. 2000 - интенсивное. 2. Удобство - в 2 места не тыкаешь каждый раз. 3. Неполное пересечение в тематике - расширение зоны. PS я не готов спорить на эту тему, т.к. у меня нет никакого глубокого мотива биться за тему. Своё мнение я высказал как мог. Thx

Tenni
22.08.2017
08:59:06
"слияние" всегда плохо.