
here1am
26.06.2017
14:34:35
может, он не знает, что такое "страхование" и какой уровень покрытия

Al
26.06.2017
14:46:38
про БД кстати, если кто нибуть когда нибуть найдет логику в запросах tinkerpop, раскажите мне пжлст.. у меня уже мозг опух в попытках понять

Vladislav
26.06.2017
14:47:58
А что это?

Al
26.06.2017
14:48:06
казино и лотереи неврно курят в стороне, методом научного тыка удается получать то что нужно. но понять почему оно так ...

Google

Al
26.06.2017
14:48:33
это у апача такой язык есть

Vladislav
26.06.2017
14:49:00
Что-то все продукты апача смотрел, не припомню такого

Al
26.06.2017
14:49:03
http://tinkerpop.apache.org/docs/current/reference/#preface

Vladislav
26.06.2017
14:49:06
Это в чем?

Al
26.06.2017
14:49:17
в гремлене

Fike
26.06.2017
14:49:48

Vladislav
26.06.2017
14:49:51
Блин, опять графы

Al
26.06.2017
14:50:53
Блин, опять графы
ну если ты предложишь вариант описания множеств и их отношений между собой лучше чем графы, то я с радостью выслушаю. пробовали затолкать в постгре, получились графы на костылях

Vladislav
26.06.2017
14:52:03
Не, я просто с графами в БД вообще не работал, даже не могу представить, где и как их использовать

Alex
26.06.2017
14:53:50
ох зачем я это увидел
когда то пилил свою графовую БД
даже где-то используется в продакшене )

Al
26.06.2017
14:54:26
ну в данном случае. это больше иследование чем использование. есть такое "обобщение множеств". но в данном случае еще нужно сохранять наследственность этих множеств.
грубо говоря можно представить как кучу точек, в которой ты обводишь группы из этих точек и группы пересекаются и имеют вложения других групп и все это растет постоянно.

Google

Alex
26.06.2017
14:55:08
не проще ли это в памяти это держать и хранить только агрегаты ?

Vladislav
26.06.2017
14:56:24

Al
26.06.2017
14:56:27
держать можно в чем угодно. вопрос как это описывать. да и размеры минимально 10 миллионов точек и на каждую точку в среднем 15 000 связей
при этом оно все динамически изменяется постоянно

Alex
26.06.2017
14:57:34
память сейчас дешевая, у меня просто есть похожий кейс
правда я щас смотрю больше на тензоры всякие для всего этого
иначе сильно быстро приходит проклятие размерности )

Vladislav
26.06.2017
14:59:40

Al
26.06.2017
15:00:32
ну оно может бы и в таблицах работало. если бы не менялось динамически. а так первая версия была на векторах обьединеных в пачку и создающих сколько то мерный массив
а так оно сейчас в кассандре складываается через януса.. и собственно и находится все в оперативке
просто процесс сериализации векторов и выгрузки на диск а потом обратной загрузки. при количестве обьектов в несколько сот миллионов.. да ну его нафиг такие приключения

Alex
26.06.2017
15:05:11
пока бы просто мат модель обкатать

Al
26.06.2017
15:18:51
просто в процессе работы получается что на 1 метр обобшеных данных создается 1 гиг логов базы
кассандра вроде порезвее на запись. вот и проверим насколько ее хватит
где то видел даже кейсы что кассандра записывает все. и не всегда можно получить назад то что только что записал в нее. типа еще не дошло до выдачи но сохранилось

Fike
26.06.2017
15:26:58
eventual consistency
если с одной нодой работать, то такого быть не должно, она свежие данные должна в memtable хранить (или как там это называется)

Alex
26.06.2017
15:28:37
да у меня уже мысль свое сварганить

Google

Fike
26.06.2017
15:28:39
ага, memtable это просто представление WAL в памяти

Alex
26.06.2017
15:28:44
на си по быстрому
заточенное под хранение таких данных

Al
26.06.2017
15:35:33

Alex
26.06.2017
15:38:01
ну у меня задачки попроще
примерно представляю как это можно хранить

Maria
26.06.2017
15:40:01
Всем привет! Ребят, ищем дата саентиста в хоккейную аналитику, Москва, проект живой и технологичный https://antirabstvo.ru/job/iceberg-moscow-34-data-scientist-hockey/
Пишите в личку!

here1am
26.06.2017
15:43:31

Maria
26.06.2017
16:12:28

Ivan
26.06.2017
16:19:55

Alex
26.06.2017
16:20:26
Ищет пожарная, ищет милиция...

Al
26.06.2017
16:21:52

Ivan
26.06.2017
16:22:04
Мне проект зашел

Maria
26.06.2017
16:22:50

Al
26.06.2017
16:23:10

Maria
26.06.2017
16:23:15
https://youtu.be/MRQVlMTTj9k
вот про проект и что мы делаем

Ivan
26.06.2017
16:23:32

Maria
26.06.2017
16:23:41
например, NHL

Google

Ivan
26.06.2017
16:23:58
А если вам сказать что они сдают оборудование NHL за 200 млн зелени в сезон, вы передумаете?

Maria
26.06.2017
16:24:24
Но вы правы, в россии еще очень туго с пониманием, для чего вообще нужна спортивная аналитика

Al
26.06.2017
16:25:53

here1am
26.06.2017
16:41:34
дата саентист будет обрабатывать данные через встроенные в субд процедуры и функции?

Al
26.06.2017
16:45:28

Maria
26.06.2017
16:46:37
Ребят, такое ощущение, что я не по адресу вообще зашла) простите если так)

Al
26.06.2017
16:48:07

Admin
ERROR: S client not available

Maria
26.06.2017
16:48:43
да, стиль общения в нашей ит-компании существенно отличается)

Al
26.06.2017
16:49:56
Этот стиль не изменился за 29 лет от слова совсем. Ваша компания видимо что то особенное.

Maria
26.06.2017
16:49:57
И почему-то у меня ощущение, что будь мы все лицом к лицу в реальной жизни, стиль общения также отличался от того, что звучит в чате)

Al
26.06.2017
16:53:04
Со времен фидо. Тонны сарказма и скептическое отношение ко всему и не только среди русскоговорящей части ит. Я понятия не имею где вы смогли видеть других ит. Может они и не ит совсем?

Vladislav
26.06.2017
16:59:48
Самое обидное, что касяки HR перекладывают на соискателей...

here1am
26.06.2017
17:02:59

Евгений
26.06.2017
17:03:38
Есть кто шарит в серверах, я разрабатываю сервис облачного хранения данных. В ЛС.

Google

Vladislav
26.06.2017
17:04:27

here1am
26.06.2017
17:04:27

Ivan
26.06.2017
17:07:08
или не подсказывать?

Vladislav
26.06.2017
17:07:39
В базах нужно читать данные
Хранить никому не уперлось

Maria
26.06.2017
17:07:49

Alex
26.06.2017
17:07:57
базы нужно держать на серверах :)

Maria
26.06.2017
17:08:02

Ivan
26.06.2017
17:08:06

Vladislav
26.06.2017
17:10:27
ну оооок
А тут без ок, я раньше тоже думал, надо хранить все, вот только толку?
Сейчас, когда ужат в рамках коммьюнити версии БД, я очень четко стал граничить, что надо, а что для галки

here1am
26.06.2017
17:12:08
В базах нужно читать данные
хорошо, допустим. какой дба тебе нужен? у тебя ж там не сферическая база в вакууме. какие скиллы, какие задачи, сколько платить будешь?

Vladislav
26.06.2017
17:12:49
А так, ответ выше

Al
26.06.2017
17:15:37

Vladislav
26.06.2017
17:16:12
Хотя конечно жалко, когда с нуля поднимаешь и проект и людей

Al
26.06.2017
20:02:31

Vladislav
26.06.2017
20:04:09

Al
26.06.2017
20:04:59