Dmitry
21.09.2017
12:46:26
а, звиняюсь )
Vladislav
21.09.2017
12:46:30
И вот такие ошибки у вертики: Aggregate function calls in subqueries cannot refer to columns in parent (outer) query
И вот такие: Subquery aggregate expression that refers a correlated column is not supported
Ilia
21.09.2017
12:51:10
Тебе оконные функции не подойдут?
Google
Vladislav
21.09.2017
12:51:30
подошли бы, если бы данные нормально лежали
хотя...
Ilia
21.09.2017
12:51:46
Я только не помню, есть ли они в Vertica
А что значит "номально лежали", если можно отсортировать.
Vladislav
21.09.2017
12:53:04
там дубли статусов и дат, но кажется я понял, как это отфильтровать
хотя нет, не взлетит
Может быть дублирование того статуса, который в первой дате
Ilia
21.09.2017
12:54:38
Vladislav
21.09.2017
12:55:00
пиво отменяется, пока...
Ilia
21.09.2017
12:55:08
Vladislav
21.09.2017
12:55:12
?
Ilia
21.09.2017
13:03:33
проблема в том, что может быть такие записи:
client1, status1, dt1
client1, status0, dt2
client1, status1, dt2
client1, status0, dt3
из которых надо получить:
client1, dt1, dt3
Как бы self join таблицы по прочим условиям и неравенству статусов (но разные записи), затем агрегация дат в минимальную и максим. и формирование полного набора.
не?
Google
Vladislav
21.09.2017
13:04:32
Al
21.09.2017
13:04:35
а может быть такие записи:
client1, status1, dt1
client1, status1, dt2
client1, status0, dt2
client1, status1, dt3
из которых надо получить:
client1, dt2, dt3
Так и не понял в чем затык
Vladislav
21.09.2017
13:04:48
вот так сделал, сейчас буду проверять, все ли верно
Вот проблема:
мне надо выкинуть еще те строки, у которых статус менялся из 3 в 3
Al
21.09.2017
13:07:19
Vladislav
21.09.2017
13:07:53
Al
21.09.2017
13:10:11
Андрей
23.09.2017
19:13:46
всем привет. поделитесь пожалуйста мыслями на тему версионированного хранения JSON
хочу ранить историческую инфу в виде множества разных json
причем одни и те же json сообщения могут совпадать целиком, кроме даты получения сообщения, и тогда нужно просто проапдейтить дату, без обновления версии
в elastic есть версии документов
а есть и RethinkDB
которая ориентирована на json
а можно и в посгрес зафигачить =)
Ilya
23.09.2017
19:30:26
тебе придется хранить идентификатор документа и отдельными записями его версии
с индексами будет секас )
146%
Google
Андрей
23.09.2017
19:31:37
с индексами какимими? чтоб быстро добыть конкретную версию конкретного документа?
мне в принципе быстро нужно последнюю добывать
Ilya
23.09.2017
19:32:11
ну как. если ты на конкретную версию документа начнешь завязывать дополнительные данные
как то метатеги. еще что-то
из других таблиц
то придется версионировать и их
Андрей
23.09.2017
19:33:11
аа, а в природе наверна не бывает составных индексов, части которых составлены по разным таблицам, да?
а какие - нибудь рулесы с посгри с хинтами? эт я просто фантазирую, начитавшись мануалов
Ilya
23.09.2017
19:34:44
ну смотря какой исчерпывающий json ты будешь хранить в базе
просто в друпале в одном проекте мы пожрали говна с версиями документов
когда join нормально нельзя было заставить работать :)
Андрей
23.09.2017
19:35:35
а чт означит, какой? уровни вложенности или просто размер?
Ilya
23.09.2017
19:35:43
ну как. если ты на конкретную версию документа начнешь завязывать дополнительные данные
то придется версионировать и их
ну обобщенно
Андрей
23.09.2017
19:35:55
да я вот даже не надеюсь на джойны =)
Ilya
23.09.2017
19:35:59
есть у тебя запись в блоге
у нее есть версии
у версии 1 один набор метатегов. у версии 2 второй.
соответсвно таблица таксономических связок тэгов учитывает версии
Google
Ilya
23.09.2017
19:37:02
и когда ты делаешь листинг статей по тегу система делает фулскан
зато все занормализовано
(:
вот потому вопрос. насколько ИСЧЕРПЫВАЩИМ будет то что ты напихаешь в json документа?
это во первых. по каким критериям ты будешь эти документы из базы извлекать?
да, можно создаь индексы по нутру json но наличие версии будет тебе портить малину )
Андрей
23.09.2017
19:39:21
таксономические связки
Admin
Андрей
23.09.2017
19:39:45
почитаю, что это такое
Ilya
23.09.2017
19:40:07
ну id документа, версия документа, ид тэга
а потом тебе при извлечении надо все будет отсортировать по времени, правда? )
по времени созданяи да? )
и ходить по этому с лимитом
Андрей
23.09.2017
19:41:33
ну не то чтобы отсортировать
что-то типа представления над данными в идеале, которое показывает срез по полям
может поделишься рекомендациями, как сделать json исчерпывающим для такого?
на примере жсона из одно поля и даты сбора значения этого поля
буду оч признателен
Ilya
23.09.2017
19:44:34
Андрей
23.09.2017
19:44:37
хотя толку от этого
Google
Андрей
23.09.2017
19:44:40
=))
ясно
Ilya
23.09.2017
19:44:57
у тебя все равно будут сопли которые торчат наружу в другие таблицы
Андрей
23.09.2017
19:45:15
а про rethinkdb чего-нить знаешь?
Ilya
23.09.2017
19:45:30
неа. я только с реляционками работаю
Андрей
23.09.2017
19:45:38
а это ты про посгрес?
или вообще
а, понятно
я б не хотел тоже эти носкуль.. но структура может сильно меняться
а кстати, можно, интересно, попросить посгрю поискать че-нить в монге или эластике =)
ууух
хотя зачем..
ладно, спасибо, буду читать все подряд дальше
Ilya
23.09.2017
19:48:17
по мне nosql это маркетинг
и все
Андрей
23.09.2017
19:48:53
еще один способ жрать ресурсы недумая =)
Al
23.09.2017
19:59:50
Андрей
23.09.2017
20:00:16
tnx!
читану