@clickhouse_ru

Страница 624 из 723
Nick
17.08.2018
07:54:30
"ссылки на сам Яндекс не считаются независимыми" вот это маразм дичайший. Какого хера ?

если яндекс это разработчик, где по их мнению должны размещаться ссылки?

Nicholas
17.08.2018
07:59:23
Доля правды есть, я думаю это воспринимаемся как топик который создала компания, без значимый пользы остальным

Nick
17.08.2018
07:59:41
субъективщина чистой воды

Google
Nick
17.08.2018
08:00:29
https://ru.wikipedia.org/wiki/MongoDB

в чем различие?

пусть в статье вики укажут ссылку на гитхаб с исходниками, мало ли

Kirill
17.08.2018
08:02:09
в чем различие?
Как минимум в Литература Кайл Бэнкер. MongoDB в действии = MongoDB in Action. — ДМК Пресс, 2014. — 394 с. — ISBN 978-5-97060-057-3. Kristina Chodorow. MongoDB: The Definitive Guide, 2nd Edition. — O'Reilly Media, Inc., 2013. — 432 с. — ISBN 978-1-4493-4468-9. David Hows, Peter Membrey, Eelco Plugge, Tim Hawkins. The Definitive Guide to MongoDB: A complete guide to dealing with Big Data using MongoDB, Third Edition. — Apress, 2015. — 376 с. — ISBN 978-1-4842-1183-0. Eelco Plugge, Peter Membrey, Tim Hawkins. The Definitive Guide to MongoDB: The NoSQL Database for Cloud and Desktop Computing. — Apress, 2010. — 327 с. — ISBN 1-4302-3051-7. Mithun Satheesh; Bruno Joseph D'mello; Jason Krol. Web Development with MongoDB and NodeJS - Second Edition. — Packt Publishing, 2015. — 300 с. — ISBN 978-1-78528-745-9. Steve Hoberman. Data Modeling for MongoDB. — Technics Publications, 2014. — 226 с. — ISBN 978-1-935504-70-2. Mitch Pirtle. MongoDB for Web Development. — Addison-Wesley Professional, 2011. — С. 360. — ISBN 9780321705334.

Nicholas
17.08.2018
08:02:45
Плюс в примечаниях ещё есть

Nick
17.08.2018
08:03:29
я ж говорю, добавить в примечение ссылки на гитхаб и на тот же habrahabr (там статей хуева туча)

Kirill
17.08.2018
08:08:31
я ж говорю, добавить в примечение ссылки на гитхаб и на тот же habrahabr (там статей хуева туча)
На хабре статьи от Яндекса, можно на бложик Cloudflare ссылки дать.

Nick
17.08.2018
08:08:44
не только от яндекса

Mike
17.08.2018
08:10:25
Тут статью в википедии собираются удалять https://ru.wikipedia.org/wiki/Википедия:К_удалению/15_августа_2018#ClickHouse
и абсолютно правильно собираются. Не понимаю вашего возмущения. Статья действительно незначима.

Nick
17.08.2018
08:11:10
https://habr.com/post/322620/ https://habr.com/post/324846/ https://habr.com/company/oleg-bunin/blog/351308/ как минимум они не от яндекса

Mike
17.08.2018
08:12:45
про монго статья гораздо более ёмкая и имеет хоть какой-то смысл.

Nick
17.08.2018
08:13:03
Возмущение в том, что причины высосаны из пальца

Mike
17.08.2018
08:13:42
А в статье о кликхаусе просто перевод документации (или копипаста, я не знаю). Имхо, я согласен с тем, что статья не значима в смысле википедии и ей там (в том варианте, в котором она сейчас лежит) не место

Google
Nick
17.08.2018
08:13:46
Статья по кликхаусу тоже имеет смысл. Как минимум чтобы люди познакомились и перешли на более узкоспециализированные блоги по теме

Nick
17.08.2018
08:15:06
А для чего?

и для знакомства в том числе

Mike
17.08.2018
08:18:13
ну сама по себе статья ничего нового по сравнению с документацией не превносит. Хотелось бы увидеть отдельным разделом упоминания, отдельным — список проектов, которые используют, отдельным — мнения о том, почему кликхаус хорош, почему плох, с кем его корректно сравнивать, с кем — нет. тогда это было бы да. А так — эту информацию любой интересующийся кх и так найдёт, а тому, кто не интересуется конкретно кх, это не будет полезно, мне кажется. хотя, как знать.

Nick
17.08.2018
08:19:20
Ну мне кажется что статья быть дожна, как минимум потому что в статье про колоночные СУБД должны быть ссылки на статьи и по Vertica и по Clickhouse

Очевидно что каждый останется при своем мнении

Mike
17.08.2018
08:20:01
Да, это верно. Статья быть должна, с этим я и не спорю. > ссылки на сам Яндекс не считаются независимыми. это хороший аргумент.

Pavel
17.08.2018
08:20:23
хм. искал в свое время колоночную субд, пока меня знакомый в кх не ткнул, я про него даже не слышал

Nick
17.08.2018
08:20:24
Не могу с вами согласиться)

Pavel
17.08.2018
08:20:35
так что не все так однозначно

Nick
17.08.2018
08:21:46
вот вот

Pavel
17.08.2018
08:22:03
и еще там упоминаются гуглячьи решения, которые вообще исключительно внутренние

что еще страннее

Mike
17.08.2018
08:22:28
Ну так можно же сделать правку и упомянуть там кх! и это будет как раз уже аргументом: статья востребована и дополняет энциклопедию.

Nick
17.08.2018
08:22:37
логично

Google
Mike
17.08.2018
08:24:24
То есть надо не исправлять статью, чтобы её не удалили, а подумать, зачем она действительно нужна, и показать это остальным — что мы, вроде как, и поняли. А дальше уж тот, кому не лень, залогинится, может даже кто-нибудь из Яндекса найдёт время :)

Yury
17.08.2018
08:55:04
Всем привет! Вчера на митапе в СПБ говорилось про табличную функцию odbc наряду с другими табличными функциями, но в документации по ней информации нет (а по другим есть). Где можно найти информацию?)

Александр
17.08.2018
09:13:13
https://github.com/yandex/ClickHouse/blob/508b0fbd346d489e1ebb4b448e72f236c8b07a92/dbms/src/TableFunctions/TableFunctionODBC.h#L11

Дальше описание имеется

Yury
17.08.2018
09:17:56
Спасибо!

Evgeny
17.08.2018
11:25:56
добрый день! А можно где-то увидеть презентации по вчерашнему митапу в Питере?

Александр
17.08.2018
12:12:42
добрый день! А можно где-то увидеть презентации по вчерашнему митапу в Питере?
Я полагаю, что Алексей чуть позде выложит все и напишет

Evgeny
17.08.2018
12:14:45
Спасибо

Kirill
17.08.2018
12:15:32
Вообще рано или поздно все презентации выкладываются тут https://github.com/yandex/clickhouse-presentations

Michal
17.08.2018
12:19:09
Поправил статью на википедии, думаю теперь должно быть ок. Почитайте / поправьте если что-то плохо получилось, или очепятки какие-то. https://ru.wikipedia.org/wiki/ClickHouse

Vladimir
17.08.2018
12:26:01
Всем привет! Гружу данные в clickhouse из CSV. В данных есть ip-адрес в виде строки. Могу ли я в инсерте сделать IPv4StringToNum?

и правильно ли я понимаю, что ip-адрес лучше хранить в UInt?

Vladimir
17.08.2018
12:27:20
Понял, спасибо

Kirill
17.08.2018
12:28:33
и правильно ли я понимаю, что ip-адрес лучше хранить в UInt?
Мы и IPv4 и v6 храним в одном поле, поэтому нам, например, для этого нужен FixedString(16)

Vladimir
17.08.2018
12:29:14
Т.е. вы их не перегоняете в UInt, а прямо со строкой работаете?

Не мерили ли разницу с UInt?

Kirill
17.08.2018
12:29:41
Pavel
17.08.2018
12:30:06
uint64+uint64 же

Google
Vladimir
17.08.2018
12:30:18
ну да, логично)

Kirill
17.08.2018
12:30:21
если в КХ нет встроенного бинарного типа мы используем FixedString для более компактного представления некоторых типов

Vladimir
17.08.2018
12:34:30
https://github.com/roistat/go-clickhouse вот тут люди похоже на уровне библиотеки превращают ip в num

Alexey
17.08.2018
12:37:35
Добрый день. Скажите пожалуйста, процесс репликации проходит через Zookeeper'ы, или ClickHouse ноды прямиком общаються друг к другу ?

Вот например я сделал Альтер

Как информация об этом накатывается на другие сервера ClickHouse ?

Информация о том что сервер проделал Альтер передается в Zookeeper, там все таблицы должны привезтись к такому же виду в Zookeeper, после чего другие ClickHouse сервера подтягивают изменения с Zookeeper, верно ?

Alexey
17.08.2018
12:41:30
То есть то что я выше написал правильно ?

Kirill
17.08.2018
12:42:48
То есть то что я выше написал правильно ?
Да, для репликации ведется лог и который пишется в ZK (не данные) и все сервера этот лог "проигрывают", напрямую они не общяются между собой, единственное обращение - это стягивание кусков по http

Alexey
17.08.2018
12:43:50
".... единственное обращение - это стягивание кусков по http...." Каких кусков ? самих данных ?

Alexey
17.08.2018
12:45:43
То есть репликация идет не только через Zookeeker. Она сначала выполняется на Zookeeper, а потом данные передаются не посредственно между серверами

Kirill
17.08.2018
12:47:28
То есть репликация идет не только через Zookeeker. Она сначала выполняется на Zookeeper, а потом данные передаются не посредственно между серверами
Нет, там все примерно так: данные пишутся на диск, в ZK добавляется запись о новом куске в таблице, сервера видят что куска у них нет и скачивают его (упрощенно).

Konstantin
17.08.2018
12:47:28
сырые данные по сайтам лучше собирать в разные базы и потом методом кластер стотроить общий отчет? или лучше все в одну базу пушить?

Dmitry
17.08.2018
13:08:47
А почему select toUInt64(111111) from table format JSON возвращает "1111111"

Кто нибудь сталкивался с таким?

Google
papa
17.08.2018
13:09:13
потому что uint64

Dmitry
17.08.2018
13:10:19
потому что uint64
В смысле? Почему интовое поле и без принудительного привидения возвращает стринг

papa
17.08.2018
13:10:25
некоторые языки программирования плохо себя ведут с длинными числами, поэтому есть возможность отдавать их в кавычках, есть возможность делать это без кавычек

Dmitry
17.08.2018
13:10:40
потому что format JSON, не?

papa
17.08.2018
13:12:35
либо поменялся тип, либо поменялся output_format_json_quote_64bit_integers

Максим
17.08.2018
14:11:24
Добрый день, есть возможность как нибудь ускорить WHERE t IN (SELECT ...), если известно, что возвращаемое во вложенном SELECT множество сортировано ?

Kirill
17.08.2018
14:16:55
Добрый день, есть возможность как нибудь ускорить WHERE t IN (SELECT ...), если известно, что возвращаемое во вложенном SELECT множество сортировано ?
Убедится что t в индексе и убедиться что у вас не сильно старая версия и она использует ПК для IN

Максим
17.08.2018
14:21:35
Убедится что t в индексе и убедиться что у вас не сильно старая версия и она использует ПК для IN
У нас t - это tuple(test_id, tun_id), и оба они ПК: ORDER BY (test_id, id) и в таблице внутреннего SELECT, и во внешней таблице тоже. Можно ещё что-то сделать для того, чтобы ускорить эту часть запроса?

Страница 624 из 723