@clickhouse_ru

Страница 20 из 723
Виктор
24.11.2016
08:35:46
Ну в смысле: float всегда обладает вещественной частью

мантисса же

То есть, всегда будет неточным

Evgeniy
24.11.2016
08:36:32
мантисса же
угу ... для того чтобы счиать сотни лярдов какой тип подойдет ?

Google
Виктор
24.11.2016
08:36:44
Int64

норм вроде

Переполнить будет тяжело =)

Даже если все деньги на планете перевести в старые белорусские рубли и умножить на 1000000

Evgeniy
24.11.2016
08:38:58
Даже если все деньги на планете перевести в старые белорусские рубли и умножить на 1000000
когда пилишь деньги на продукцию , нужно 9 знаков после запятой ) т.е. нежданчик в том что всегда будет погрешность, которую нужно будет объяснять

Anatoly
24.11.2016
08:39:22
правда, для сотен миллиардов тогда в int64 битиков не останется, это проблема.

Roman
24.11.2016
08:42:40
Используй два Int64 — для целой и для дробноый части. Суммарная точность получится 28 знаков.
Лучше конечно, decimal иметь "из коробки" (как тут http://docs.oracle.com/javadb/10.6.2.1/ref/rrefsqlj15260.html) — мечты-мечты...

Виктор
24.11.2016
08:44:51
Да, decimal это понятная хотелка

Будет публичный трекер с лайками, посмотрим сколько налайкают =)

А так можно в Int64 запихивать и должно быть отлично

Roman
24.11.2016
08:45:19
Да, decimal это понятная хотелка
Сложность — свой формат изобратать? Или "под капотом" как раз с двумя интами нужно будет работать?

Google
Виктор
24.11.2016
08:45:34
Да там всё понятно как делать

Виктор
24.11.2016
08:45:45
Но надо написать, все операции сделать, векторная обработка

issues не то немного все-таки

Там лайков нет!

Igor
24.11.2016
08:46:10
вообще-то есть!

ну, правда, это внутрь заходить надо

Roman
24.11.2016
08:46:22
Но надо написать, все операции сделать, векторная обработка
А, точно... уже заценил ваше описание архитектуры.

Igor
24.11.2016
08:46:23
https://github.com/yandex/ClickHouse/issues/118#issuecomment-249505041

Виктор
24.11.2016
08:46:25
о, действительно есть

Виктор
24.11.2016
08:47:14
О, можно отсортировать по лайкам!

Так всё есть

Igor
24.11.2016
08:47:30
ух ты, и правда

огонь ))

Виктор
24.11.2016
08:47:41
Только не выводится, увы

Roman
24.11.2016
08:47:50
Там лайков нет!
Там еще теги сделать бы, типа "бизнес-кейс" или "так принято" (имеется в виду, в других продуктах) — чтобы сразу было видно, что обоснованно хоть как-то, а что просто "космолет" с кучей лайков

Виктор
24.11.2016
08:47:57
Да-да, уже вижу

Anatoly
24.11.2016
08:48:36
Только не выводится, увы
репортинг в гитхабе - боль, да.

продать им кликхаус что ли

Google
Виктор
24.11.2016
08:49:00
Проблема в том что не очевидно обычным людям что надо лайкать

Для повышения приоритета

Но вроде можно решить

Roman
24.11.2016
08:49:21
Вот-вот

Виктор
24.11.2016
08:50:35
Подумаем ,может, так и сделаем

Выглядит очень логичным.

Сделать тэг Features и лайками их приоретизировать, что-то в этом роде

Roman
24.11.2016
08:51:19
Сделать тэг Features и лайками их приоретизировать, что-то в этом роде
И два рейтинга — народный и рейтинг экспертов :)

Виктор
24.11.2016
08:51:28
Потом рынок накрутчиков появится

Roman
24.11.2016
08:51:38
Это будет признанием

Dmitry
24.11.2016
08:52:10
лайкать надо деньгами :)

если уж деньги в CH считать

:)

Roman
24.11.2016
08:52:40
лайкать надо деньгами :)
это как раз "рейтинг экспертов" или "рейтинг дорогой редакции"

Anatoly
24.11.2016
08:52:45
Сделать тэг Features и лайками их приоретизировать, что-то в этом роде
теги не могут ставить те, у кого нет прав на запись в репу, вроде бы

Виктор
24.11.2016
08:52:58
Ну это понятно, тэги сами расставлять будем

Roman
24.11.2016
08:53:33
Ну это понятно, тэги сами расставлять будем
ну этого будет достаточно — рейтинг с фильрацией по тегам

@the_real_jkee, кстати, вы с Табло (конторой) как-то начали общаться по требованиям с их стороны по совместимости протоколов и sql?

Я знаком с их сейлом, который раньше Россию и ближайшие страны курировал. Могу свести.

Google
Roman
24.11.2016
08:56:10
Ботыр Байзаков. Вероятно его многие партнеры и пользователи Табло знают — но вдруг кроме меня вам ни кто не предложил познакомить :)

Anatoly
24.11.2016
08:57:01
а можно для людей не в теме, что такое - Табло? ссылки достаточно, спасибо.

Roman
24.11.2016
08:57:44
а можно для людей не в теме, что такое - Табло? ссылки достаточно, спасибо.
Можно сразу рекламу? :) http://www.tableau.com/about/blog/2016/2/fourth-year-gartner-names-tableau-leader-magic-quadrant-49719

Anatoly
24.11.2016
08:59:13
о, цена есть на сайте. бывает же такое.

Vil
24.11.2016
09:00:08
1.9к$ за лицензию и потом (после первого года) по 400$ за поддержку (обновление, поддержка селером и так далее)

Darafei
24.11.2016
09:00:39
про цену на сайте мне больше всего нравится тут: http://www.spacex.com/about/capabilities

Vil
24.11.2016
09:01:02
Хотите стать сертифицированным специалистом? Пожалуйста, 250$ за экзамен)

Roman
24.11.2016
09:01:04
о, цена есть на сайте. бывает же такое.
Угу. Декстопная версия продается поштучно. Собственно у них такая стратегия продажи — "купите одну лицензию, чтобы попробовать, а если понравится приходите за добавкой". Есть еще лицензии на веб-интерфейс. Цена в два раза ниже, но минимальный пакет 10 штук. В последних версиях в веб-версии появилась возможность не только смотреть, но и редактировать отчеты — полнофункционально, но, конечно, не так удобно как на декстопе. #tableau

Dmitry
24.11.2016
09:09:53
За такие деньги они сами должны дописать в КХ поддержку SQL :))

Darafei
24.11.2016
09:10:34
нормальные деньги а сколько оно, по-вашему, должно стоить? :)

Roman
24.11.2016
09:12:38
За такие деньги они сами должны дописать в КХ поддержку SQL :))
Так возможно и будет, когда у КХ накопится пользовательская база — Tableau будет интересно всем им продать свои инструменты. С другой стороны у КХ может начать расти количество пользователей, если появится возможность смотреть на данные через Tableau. В общем это вопрос переговоров :)

Alexey
24.11.2016
09:14:01
А текущая, исходя из контекста в котором делали ЯКХ, должна быть share nothing -- какждый сервр работает со своей копией данных, чтобы масштабироваться без узких мест в диске.
Запустить несколько серверов с одной data директорией не получится - они не будут понимать об изменении данных. При старте даже есть защита - проверяется, что другой сервер не работает с этой же директорией. Можно создать на shared-хранилище несколько независимых директорий для разных серверов. Получается так: shared-nothing архитектура поверх shared-хранилища.

Darafei
24.11.2016
09:16:34
а distinct нельзя сделать rewrite в group by, и выпилить distinct из движка? :)

Roman
24.11.2016
09:16:59
Для GROUP BY реализовали больше специализаций (по разным комбинациям типов столбцов), а для DISTINCT только один, generic вариант. Это решаемо.
Ламерский вопрос — вы будите делать свою логику для distinct'а? Или что-то вроде rewrite'а на какой-нибудь самый оптимальный group by?

Alexey
24.11.2016
09:17:21
И еще небольшой типа наброс... мне кажется, что сервер версии 1.1.54046 (из пакета) работает процентов на 10 медленнее версии 1.1.53981 (из пакета). Запускаю то один, то другой, тыкаю запросы, и первый обычно медленнее слегка.
На нашем бенчмарке почему-то не видно. Но вообще случай интересен. Попробуйте сделать воспроизводимый бенчмарк. Простейший вариант - выполнение одного запроса в бесконечном цикле. Если разница подтвердится, то я попрошу вас скинуть perf report.

Roman
24.11.2016
09:17:31
а distinct нельзя сделать rewrite в group by, и выпилить distinct из движка? :)
О, значит не я один такой ламер! :) Или не ламер :)

Darafei
24.11.2016
09:17:56
ну, в постгресе много запросов ускоряются именно реврайтом :)

Google
Alexey
24.11.2016
09:18:32
а distinct нельзя сделать rewrite в group by, и выпилить distinct из движка? :)
Почти можно. Сейчас ещё есть отличие, что DISTINCT умеет отдавать данные потоково, по мере их чтения, а GROUP BY только в конце. Но понятное дело, что можно и GROUP BY так научить, если нет ни одной агрегатной функции.

Alexey
24.11.2016
09:22:50
вопрос по поводу временных таблиц. можно утверждать что чтение и запись из них всегда консистентно . т.е. можно ли их использовать для временного хранения предрасчитанных данных для дальнейшей обработки и сохранения в нормальных таблицах ?
Временные таблицы имеют по-умолчанию движок Memory. Запись в такие таблицы атомарна на уровне одного блока записываемых данных (~миллион строк). Чтение видит снэпшот данных на момент начала чтения. Также можно создавать не-временные таблицы типа Log, TinyLog для промежуточных данных.

Anatoly
24.11.2016
09:23:36
кстати, является ли запуск в докер-контейнере рекомендуемым? если данные в контейнер через volume положить?

Alexey
24.11.2016
09:24:26
кстати, является ли запуск в докер-контейнере рекомендуемым? если данные в контейнер через volume положить?
Мы не можем рекомендовать, потому что сами не используем так. Но и противопоказаний у нас тоже нет.

Igor
24.11.2016
09:24:39
А есть другие преимущества у TinyLog/Log перед Memory? Кроме сохранения данных при падении/перезагрузке сервера

Alexey
24.11.2016
09:26:14
Ботыр Байзаков. Вероятно его многие партнеры и пользователи Табло знают — но вдруг кроме меня вам ни кто не предложил познакомить :)
С ним конкретно ещё не знакомился. Было бы хорошо. Общался только чуть-чуть с неким Dmitry Chirkov. Далеко ещё не продвинулись.

Igor
24.11.2016
09:27:33
Блин, а логично. Извините))

Alexey
24.11.2016
09:29:20
Про трекер. Есть одна особенность: внутрияндексовый трекер слишком хороший - им очень удобно пользоваться. Нам обещали сделать публичный инстанс - не буду говорить когда, чтобы не подставлять команду.

Vladislav
24.11.2016
09:29:37
Все таки, на open-source не просто так преходят, правда ведь ;)

Vladislav
24.11.2016
09:35:17
мы вместе с переходом на КХ переходим на https://redash.io

Roman
24.11.2016
09:37:00
Это конечно здорово, но я больше склоняюсь к варианту, что в следствии развития КХ в open-source, появятся open-source аналоги таблю...
Все возможно. Интерфейсно его уже скопировал, например, Oracle — см Oracle Visual Analyrzer Desktop. QlikView выпустил QlikSense. Но все "не то"... :)

Vladislav
24.11.2016
09:39:29
Все возможно. Интерфейсно его уже скопировал, например, Oracle — см Oracle Visual Analyrzer Desktop. QlikView выпустил QlikSense. Но все "не то"... :)
Есть Power Bi от MS, но там ставка на их облака, хотя и фри, на текущий момент, если платите за Office 365

Vil
24.11.2016
09:39:47
Name
24.11.2016
09:40:15
Pentaho не подойдет? http://community.pentaho.com/

Страница 20 из 723