@pgsql

Страница 713 из 1062

Yaroslav

15.03.2018
12:41:36

Давайте все хранить в текстовых файлах, это же так удобно.?

Если нам не нужны свойства RDBMS, давайте, почему же нет? Про unix-way слышали? Так вот это — один из его компонентов. Кстати, у нас что, есть только 2 способа: текстовые файлы и RDBMS?

Darafei

15.03.2018
12:41:38

все же знают, что в unix есть команда join?

man join join - join lines of two files on a common field

Aw

15.03.2018
12:46:32

Это безусловно верный путь. Но как же быть с многотерабайтными БД? Оно то конечно на 5 строчках в файле работает быстро. И тут я думаю проблема в мощности серверов, решение которой уничтожит все проблемы с производительностью.?

Google

Mikhail

15.03.2018
12:46:33

все же знают, что в unix есть команда join?

Есть и сорт и уник

Darafei

15.03.2018
12:47:36

Это безусловно верный путь. Но как же быть с многотерабайтными БД? Оно то конечно на 5 строчках в файле работает быстро. И тут я думаю проблема в мощности серверов, решение которой уничтожит все проблемы с производительностью.?

сильно зависит от паттерна использования. если там типичен seq scan по всему всегда, то можно так и оставить

Aw

15.03.2018
12:51:45

сильно зависит от паттерна использования. если там типичен seq scan по всему всегда, то можно так и оставить

Именно, выключить и закапать ?

Yaroslav

15.03.2018
12:52:49

Это безусловно верный путь. Но как же быть с многотерабайтными БД? Оно то конечно на 5 строчках в файле работает быстро. И тут я думаю проблема в мощности серверов, решение которой уничтожит все проблемы с производительностью.?

А с чего Вы это вообще взяли? Если там только seq scan, эти вот "текстовые файлы" ещё и выиграют (и иногда, причём, намного)! ;)

Aw

15.03.2018
12:56:41

А с чего Вы это вообще взяли? Если там только seq scan, эти вот "текстовые файлы" ещё и выиграют (и иногда, причём, намного)! ;)

А почему там только seq scan? Никакой фильтрации или поиска не происходит?

Darafei

15.03.2018
12:57:57

потому что, например, агрегация по меняющимся принципам

Aw

15.03.2018
12:58:52

потому что, например, агрегация по меняющимся принципам

А как же умные алгоритмы индексации и кластеризации? Почему их не применяют?

Darafei

15.03.2018
12:59:27

это всё работает, когда ты знаешь, что ты с этими данными делать будешь

Yaroslav

15.03.2018
13:00:07

А почему там только seq scan? Никакой фильтрации или поиска не происходит?

Я написал "если". ;) Фильтрация —- запросто. Я больше скажу, некоторые "аналитические" БД (BIgQuery, например), у которых в основе —- всего лишь параллельный seqscan, могут, как говорится, "летать кругами" вокруг прочих (несмотря на их индексы и умные оптимизаторы).

Aw

15.03.2018
13:01:16

Я написал "если". ;) Фильтрация —- запросто. Я больше скажу, некоторые "аналитические" БД (BIgQuery, например), у которых в основе —- всего лишь параллельный seqscan, могут, как говорится, "летать кругами" вокруг прочих (несмотря на их индексы и умные оптимизаторы).

и у них логарифмическое время выборки?

Darafei

15.03.2018
13:01:29

если ты не знаешь, как будет выглядеть твой завтрашний групбай, то тебе остаётся только секскан

Aw

15.03.2018
13:03:03

Ситуация со seq scan оправдана только в одном случае, когда используется ленточный носитель данных. Да, там возможно паралельное чтение данных. но только в одном направлении.

Yaroslav

15.03.2018
13:03:26

и у них логарифмическое время выборки?

Нет, конечно. Но на практике-то результат очевиден. ;) И ещё, для некоторой сложной аналитики подходящих индексов либо совсем не бывает, либо придётся построить чуть ли не все возможные.

Google

Darafei

15.03.2018
13:04:32

и у них логарифмическое время выборки?

а зачем логарифмическое, если N/ncpu тоже устраивает?

Aw

15.03.2018
13:05:26

а зачем логарифмическое, если N/ncpu тоже устраивает?

Это сколько же надо ЦПУ на 1000 запросов в секунду? Вероятно 100?

Darafei

15.03.2018
13:05:45

откуда вы взяли 1000 запросов в секунду?

Aw

15.03.2018
13:05:58

это как пример

Darafei

15.03.2018
13:06:05

их на таких данных в день примерно три

и то из-за опечатки в первых двух

если у тебя 1000 запросов, то ты знаешь, что у тебя делается с данными

Aw

15.03.2018
13:07:15

Да, я думаю при seq scan тоже понятно что делается с данными

Darafei

15.03.2018
13:08:52

да, но как только он досчитается, все его индексы больше неактуальны

Aw

15.03.2018
13:09:37

Сложная ситуация с расчетом OLAP кубов и других структур. Там действительно иногда приходяится индексировать каждое поле. Но как показывает практика, обычно все хотят агрегацию по определенному полю. Соответственно, возможно пересчитывать каждый раз не все вподряд, а только то, что требуется, те поля которые нужны.

И вместо того что-бы искать "очень" быстрые СУБД, возможно имеет смысл задуматься над структурой хранения данных?

Darafei

15.03.2018
13:11:41

тебе, видимо, не приходилось дебажить новый дорожный граф прогоном по нему всех поездок всех пользователей

Aw

15.03.2018
13:12:06

тебе, видимо, не приходилось дебажить новый дорожный граф прогоном по нему всех поездок всех пользователей

Да, это повышает уровень сознания ?

А если серьезно, такая вещь как остовной граф (или остовное дерево) позволяет решить эту проблему

Darafei

15.03.2018
13:14:14

какую проблему, потерянный запрет поворота? или непрорисованное ребро? или неверное ограничение скорости? :)

Aw

15.03.2018
13:15:17

хотя бы можно выявить те дуги графа которые явно имеют в себе некоректное значение

Yaroslav

15.03.2018
13:17:13

Сложная ситуация с расчетом OLAP кубов и других структур. Там действительно иногда приходяится индексировать каждое поле. Но как показывает практика, обычно все хотят агрегацию по определенному полю. Соответственно, возможно пересчитывать каждый раз не все вподряд, а только то, что требуется, те поля которые нужны.

А разве OLAP-кубы —- это сложная аналитика? Это же только предопределённые агрегаты и расчёты, правильно?

Darafei

15.03.2018
13:19:21

хотя бы можно выявить те дуги графа которые явно имеют в себе некоректное значение

явных тупизмов в нём нет, есть несоответствия реальности, которые нельзя выяснить никаким другим образом, кроме как сравнить с какими-то данными, из этой реальности пришедшими

Aw

15.03.2018
13:19:58

А разве OLAP-кубы —- это сложная аналитика? Это же только предопределённые агрегаты и расчёты, правильно?

Сложность в том, что обычно строятся эти отчеты по всем данным. (Чаще конечно за период). И, как правильно было замечено, агрегаты могут менять свое значение. То есть приходится заново их пересчитывать.

Darafei

15.03.2018
13:20:53

OLAP - это просто, там ты знаешь, по чему у тебя будет групбай :)

Google

Yaroslav

15.03.2018
13:21:10

Сложность в том, что обычно строятся эти отчеты по всем данным. (Чаще конечно за период). И, как правильно было замечено, агрегаты могут менять свое значение. То есть приходится заново их пересчитывать.

Да, приходится. Но _сложнее_ они от этого не становятся. :)

OLAP - это просто, там ты знаешь, по чему у тебя будет групбай :)

+1

Aw

15.03.2018
13:24:08

Да, приходится. Но _сложнее_ они от этого не становятся. :)

Имеется ввиду сложность, точнее, стоимость расчета, а не сложность формирования OLAP

Yaroslav

15.03.2018
13:30:51

Имеется ввиду сложность, точнее, стоимость расчета, а не сложность формирования OLAP

Я имел в виду сложность самих аналитических запросов.

Alexandr

15.03.2018
13:54:21

я прошу прощения, Npgsql не поддерживает именнованные параметры? типа у меня 100 параметров в функции с дефолтными значениями и чтобы передать один параметр туда, я должен и остальные тоже прописать???

Ilnar

15.03.2018
13:57:02

http://www.mis3.local/getreport.php?_rep_code=null&_rep_id=61127916&DS_IDS=174833185&TYPE=LIS

Aw

15.03.2018
14:03:23

http://www.mis3.local/getreport.php?_rep_code=null&_rep_id=61127916&DS_IDS=174833185&TYPE=LIS

Не удается получить доступ к сайту Не удалось найти IP-адрес сервера www.mis3.local. Выполните поиск по запросу mis3 local getreport в Google ERR_NAME_NOT_RESOLVED

Ilnar

15.03.2018
14:04:47

это локальный веб сервер. прошу прощение в спешке не ту группу выбрал

Не удается получить доступ к сайту Не удалось найти IP-адрес сервера www.mis3.local. Выполните поиск по запросу mis3 local getreport в Google ERR_NAME_NOT_RESOLVED

Вася

15.03.2018
14:23:18

Комрады, есть кто настраивал wal-e вместе с stole ?

Alexandr

15.03.2018
14:48:24

я прошу прощения, Npgsql не поддерживает именнованные параметры? типа у меня 100 параметров в функции с дефолтными значениями и чтобы передать один параметр туда, я должен и остальные тоже прописать???

был неправ))

Mikhail

15.03.2018
14:49:18

походу все же придётся накатывать pgbouncer поверх pgpool :(

Mikhail

15.03.2018
14:49:24

а так всё хорошо начиналось

Миша

15.03.2018
14:49:33

Мне тут сказали что pgsql плохое решение для не больших баз. Это правда?

Mikhail

15.03.2018
14:49:48

это чушь

и она даже хрюкает...

всегда было интересно, на каком объеме заканчиваются маленькие БД и начинаются большие.

Dmitry

15.03.2018
14:52:02

Мне тут сказали что pgsql плохое решение для не больших баз. Это правда?

работает как сервис, который надо обслуживать. в этом его недостаток по сравнению с ембедед

Mike Chuguniy

15.03.2018
15:00:54

"\dt" что показывает

Mykyta

15.03.2018
15:01:21

Зачем аккаунт id варчар и 56?

Google

Oleg

15.03.2018
15:02:54

Зачем аккаунт id варчар и 56?

Это уже другой вопрос

Mike Chuguniy

15.03.2018
15:03:00

Ну и что вы хотите, у вас есть табличка users

О чем и говорит сообщение об ошибке.

Oleg

15.03.2018
15:05:23

О чем и говорит сообщение об ошибке.

я хочу, чтобы столбец в blobs ссылался на столбец в users. Значит, что она и должна существовать до того, как я создам blobs или я ошибаюсь?

Mike Chuguniy

15.03.2018
15:06:01

Естественно.

Только вот если у вас users имеет иную структуру, чем вы хотите, то получится весьма занятно.

Admin

ERROR: S client not available

Oleg

15.03.2018
15:08:19

Только вот если у вас users имеет иную структуру, чем вы хотите, то получится весьма занятно.

Всё, разобрался. Спасибо большое за помощь

Mikhail

15.03.2018
15:16:25

работает как сервис, который надо обслуживать. в этом его недостаток по сравнению с ембедед

Обслуживать? Простите, это как?

Мне почудилось или кто-то пытался сделать реляцию с блобами?

Ох ща какой я булыжник закину в огород pgpool!!!

Эта сволота, занимает коннекты у PG и не отдаёт их!

Darafei

15.03.2018
15:20:34

Обслуживать? Простите, это как?

запускать и останавливать

Mikhail

15.03.2018
15:20:41

Самое ржачное, когда у вас, к примеру, 2 pgpool в режиме watchdog

запускать и останавливать

не подсказывайте ;)

Mike Chuguniy

15.03.2018
15:21:06

запускать и останавливать

А еще есть регламентные работы. Вотъ я какое страшное слово знаю!

даже не слово, а ругательство.

Mikhail

15.03.2018
15:21:35

дооо...

а еще ему поди спирт требуется для протирки

так чё я врал то...

Google

Mikhail

15.03.2018
15:22:05

а! во!

Mike Chuguniy

15.03.2018
15:22:35

а еще ему поди спирт требуется для протирки

Спирт требуется всегда! независимо от ...

Mikhail

15.03.2018
15:22:39

вобщем когда у вас 2 pgpool в режиме watchdog, то операционный IP только на одном сервере конечно же.

Но если не дай Бог кто-то присоединится ко второму пулу

то он тут же отожрёт определенное количество коннектов на всех участниках пула ине отдаст их до перезапуска

Почему - вопрос пока не изучен.

Konstantin

15.03.2018
16:08:36

всегда было интересно, на каком объеме заканчиваются маленькие БД и начинаются большие.

База считается большой, когда перестаёт полностью влезать в память:)

VlIvYur

15.03.2018
16:12:13

В какую?

Аггей

15.03.2018
16:14:10

всегда было интересно, на каком объеме заканчиваются маленькие БД и начинаются большие.

Для себя я выделил 3 размера таблиц (не бд). До 1 млн записей - с которыми даже без индексов можно, до 100 млн - индексы нужны - но все ещё несерьёзно и более 100млн - где уже надо думать над каждой операцией, задумываться о хранении и тп

Но это о сферическом коне в вакууме конечно

Darafei

15.03.2018
16:25:58

у меня вот под рукой таблица с точками от osm на 4 гига, в ней 168 278 885 записей и count(*) сексканом за 12 секунд делается

вроде больше 100млн

вроде небольшая

Evgeniy