@pgsql

Страница 713 из 1062
Yaroslav
15.03.2018
12:41:36
Давайте все хранить в текстовых файлах, это же так удобно.?
Если нам не нужны свойства RDBMS, давайте, почему же нет? Про unix-way слышали? Так вот это — один из его компонентов. Кстати, у нас что, есть только 2 способа: текстовые файлы и RDBMS?

Darafei
15.03.2018
12:41:38
все же знают, что в unix есть команда join?

man join join - join lines of two files on a common field

Aw
15.03.2018
12:46:32
Это безусловно верный путь. Но как же быть с многотерабайтными БД? Оно то конечно на 5 строчках в файле работает быстро. И тут я думаю проблема в мощности серверов, решение которой уничтожит все проблемы с производительностью.?

Google
Mikhail
15.03.2018
12:46:33
Aw
15.03.2018
12:56:41
Darafei
15.03.2018
12:57:57
потому что, например, агрегация по меняющимся принципам

Aw
15.03.2018
12:58:52
потому что, например, агрегация по меняющимся принципам
А как же умные алгоритмы индексации и кластеризации? Почему их не применяют?

Darafei
15.03.2018
12:59:27
это всё работает, когда ты знаешь, что ты с этими данными делать будешь

Yaroslav
15.03.2018
13:00:07
А почему там только seq scan? Никакой фильтрации или поиска не происходит?
Я написал "если". ;) Фильтрация —- запросто. Я больше скажу, некоторые "аналитические" БД (BIgQuery, например), у которых в основе —- всего лишь параллельный seqscan, могут, как говорится, "летать кругами" вокруг прочих (несмотря на их индексы и умные оптимизаторы).

Darafei
15.03.2018
13:01:29
если ты не знаешь, как будет выглядеть твой завтрашний групбай, то тебе остаётся только секскан

Aw
15.03.2018
13:03:03
Ситуация со seq scan оправдана только в одном случае, когда используется ленточный носитель данных. Да, там возможно паралельное чтение данных. но только в одном направлении.

Yaroslav
15.03.2018
13:03:26
и у них логарифмическое время выборки?
Нет, конечно. Но на практике-то результат очевиден. ;) И ещё, для некоторой сложной аналитики подходящих индексов либо совсем не бывает, либо придётся построить чуть ли не все возможные.

Google
Darafei
15.03.2018
13:04:32
и у них логарифмическое время выборки?
а зачем логарифмическое, если N/ncpu тоже устраивает?

Aw
15.03.2018
13:05:26
а зачем логарифмическое, если N/ncpu тоже устраивает?
Это сколько же надо ЦПУ на 1000 запросов в секунду? Вероятно 100?

Darafei
15.03.2018
13:05:45
откуда вы взяли 1000 запросов в секунду?

Aw
15.03.2018
13:05:58
это как пример

Darafei
15.03.2018
13:06:05
их на таких данных в день примерно три

и то из-за опечатки в первых двух

если у тебя 1000 запросов, то ты знаешь, что у тебя делается с данными

Aw
15.03.2018
13:07:15
Да, я думаю при seq scan тоже понятно что делается с данными

Darafei
15.03.2018
13:08:52
да, но как только он досчитается, все его индексы больше неактуальны

Aw
15.03.2018
13:09:37
Сложная ситуация с расчетом OLAP кубов и других структур. Там действительно иногда приходяится индексировать каждое поле. Но как показывает практика, обычно все хотят агрегацию по определенному полю. Соответственно, возможно пересчитывать каждый раз не все вподряд, а только то, что требуется, те поля которые нужны.

И вместо того что-бы искать "очень" быстрые СУБД, возможно имеет смысл задуматься над структурой хранения данных?

Darafei
15.03.2018
13:11:41
тебе, видимо, не приходилось дебажить новый дорожный граф прогоном по нему всех поездок всех пользователей

Aw
15.03.2018
13:12:06
А если серьезно, такая вещь как остовной граф (или остовное дерево) позволяет решить эту проблему

Darafei
15.03.2018
13:14:14
какую проблему, потерянный запрет поворота? или непрорисованное ребро? или неверное ограничение скорости? :)

Aw
15.03.2018
13:15:17
хотя бы можно выявить те дуги графа которые явно имеют в себе некоректное значение

Darafei
15.03.2018
13:19:21
хотя бы можно выявить те дуги графа которые явно имеют в себе некоректное значение
явных тупизмов в нём нет, есть несоответствия реальности, которые нельзя выяснить никаким другим образом, кроме как сравнить с какими-то данными, из этой реальности пришедшими

Aw
15.03.2018
13:19:58
А разве OLAP-кубы —- это сложная аналитика? Это же только предопределённые агрегаты и расчёты, правильно?
Сложность в том, что обычно строятся эти отчеты по всем данным. (Чаще конечно за период). И, как правильно было замечено, агрегаты могут менять свое значение. То есть приходится заново их пересчитывать.

Darafei
15.03.2018
13:20:53
OLAP - это просто, там ты знаешь, по чему у тебя будет групбай :)

Google
Aw
15.03.2018
13:24:08
Да, приходится. Но _сложнее_ они от этого не становятся. :)
Имеется ввиду сложность, точнее, стоимость расчета, а не сложность формирования OLAP

Yaroslav
15.03.2018
13:30:51
Alexandr
15.03.2018
13:54:21
я прошу прощения, Npgsql не поддерживает именнованные параметры? типа у меня 100 параметров в функции с дефолтными значениями и чтобы передать один параметр туда, я должен и остальные тоже прописать???

Ilnar
15.03.2018
13:57:02
http://www.mis3.local/getreport.php?_rep_code=null&_rep_id=61127916&DS_IDS=174833185&TYPE=LIS

Aw
15.03.2018
14:03:23
http://www.mis3.local/getreport.php?_rep_code=null&_rep_id=61127916&DS_IDS=174833185&TYPE=LIS
Не удается получить доступ к сайту Не удалось найти IP-адрес сервера www.mis3.local. Выполните поиск по запросу mis3 local getreport в Google ERR_NAME_NOT_RESOLVED

Ilnar
15.03.2018
14:04:47
это локальный веб сервер. прошу прощение в спешке не ту группу выбрал

Не удается получить доступ к сайту Не удалось найти IP-адрес сервера www.mis3.local. Выполните поиск по запросу mis3 local getreport в Google ERR_NAME_NOT_RESOLVED

Вася
15.03.2018
14:23:18
Комрады, есть кто настраивал wal-e вместе с stole ?

Mikhail
15.03.2018
14:49:18
походу все же придётся накатывать pgbouncer поверх pgpool :(

а так всё хорошо начиналось

Миша
15.03.2018
14:49:33
Мне тут сказали что pgsql плохое решение для не больших баз. Это правда?

Mikhail
15.03.2018
14:49:48
это чушь

и она даже хрюкает...

всегда было интересно, на каком объеме заканчиваются маленькие БД и начинаются большие.

Dmitry
15.03.2018
14:52:02
Мне тут сказали что pgsql плохое решение для не больших баз. Это правда?
работает как сервис, который надо обслуживать. в этом его недостаток по сравнению с ембедед

Mike Chuguniy
15.03.2018
15:00:54
"\dt" что показывает

Mykyta
15.03.2018
15:01:21
Зачем аккаунт id варчар и 56?

Google
Oleg
15.03.2018
15:02:54
Зачем аккаунт id варчар и 56?
Это уже другой вопрос

Mike Chuguniy
15.03.2018
15:03:00
Ну и что вы хотите, у вас есть табличка users

О чем и говорит сообщение об ошибке.

Oleg
15.03.2018
15:05:23
О чем и говорит сообщение об ошибке.
я хочу, чтобы столбец в blobs ссылался на столбец в users. Значит, что она и должна существовать до того, как я создам blobs или я ошибаюсь?

Mike Chuguniy
15.03.2018
15:06:01
Естественно.

Только вот если у вас users имеет иную структуру, чем вы хотите, то получится весьма занятно.

Mikhail
15.03.2018
15:16:25
Мне почудилось или кто-то пытался сделать реляцию с блобами?

Ох ща какой я булыжник закину в огород pgpool!!!

Эта сволота, занимает коннекты у PG и не отдаёт их!

Darafei
15.03.2018
15:20:34
Обслуживать? Простите, это как?
запускать и останавливать

Mikhail
15.03.2018
15:20:41
Самое ржачное, когда у вас, к примеру, 2 pgpool в режиме watchdog

запускать и останавливать
не подсказывайте ;)

Mike Chuguniy
15.03.2018
15:21:06
запускать и останавливать
А еще есть регламентные работы. Вотъ я какое страшное слово знаю!

даже не слово, а ругательство.

Mikhail
15.03.2018
15:21:35
дооо...

а еще ему поди спирт требуется для протирки

так чё я врал то...

а! во!

Google
Mike Chuguniy
15.03.2018
15:22:35
а еще ему поди спирт требуется для протирки
Спирт требуется всегда! независимо от ...

Mikhail
15.03.2018
15:22:39
вобщем когда у вас 2 pgpool в режиме watchdog, то операционный IP только на одном сервере конечно же.

Но если не дай Бог кто-то присоединится ко второму пулу

то он тут же отожрёт определенное количество коннектов на всех участниках пула ине отдаст их до перезапуска

Почему - вопрос пока не изучен.

Konstantin
15.03.2018
16:08:36
всегда было интересно, на каком объеме заканчиваются маленькие БД и начинаются большие.
База считается большой, когда перестаёт полностью влезать в память:)

VlIvYur
15.03.2018
16:12:13
В какую?

Аггей
15.03.2018
16:14:10
всегда было интересно, на каком объеме заканчиваются маленькие БД и начинаются большие.
Для себя я выделил 3 размера таблиц (не бд). До 1 млн записей - с которыми даже без индексов можно, до 100 млн - индексы нужны - но все ещё несерьёзно и более 100млн - где уже надо думать над каждой операцией, задумываться о хранении и тп

Но это о сферическом коне в вакууме конечно

Darafei
15.03.2018
16:25:58
у меня вот под рукой таблица с точками от osm на 4 гига, в ней 168 278 885 записей и count(*) сексканом за 12 секунд делается

вроде больше 100млн

вроде небольшая

Evgeniy
15.03.2018
16:27:13
а в майисаме каунт мгновенный!

Darafei
15.03.2018
16:30:49
и по fdw?

Alexey
15.03.2018
16:33:21
если fdw умеет пушить count(*), то да!

Maksim
15.03.2018
16:36:38
если fdw умеет пушить count(*), то да!
не надо пушить - reltuples from pg_class или на худой конец tablesample system :)

Страница 713 из 1062