@rubylang

Страница 616 из 1684
I
15.11.2016
08:58:47
а чанки потом парсить и себе писать, куда надо

Alex
15.11.2016
08:58:56
Это одноразовая задача?

maier
15.11.2016
08:59:43
Постоянная, нужно сфинкс индекс обновлять по текстовым данным в кликхаус

Alex
15.11.2016
09:00:15
Тогда когда данные залезают в кликхаус они сразу же должны посылаться в сфинкс

Google
Alex
15.11.2016
09:00:28
не понимаю смысла в сфинксе если есть кликхаус, это же почти одно и тоже, нет?

maier
15.11.2016
09:00:33
Пришел кусок текста (не строк) надо выделить строки, потом оставшуюся не строку куда лучше писать и как Туда дописать чанк след

Не одно и тоже

Alex
15.11.2016
09:01:09
пишешь класс который поточно это парсит, лол

I
15.11.2016
09:01:11
я скажу так - пожалуй, это тот случай, когда за бесплатно вряд ли смогут помочь

Alex
15.11.2016
09:01:20
производительности не хватит

Ты что то не правильно архитектурно строишь, я думаю твоя идея - костыль.

maier
15.11.2016
09:01:47
?

I
15.11.2016
09:01:48
производительности не хватит
ну вот тогда всегда есть другие языки)

maier
15.11.2016
09:02:12
Эксперты ?

I
15.11.2016
09:05:40
я просто не сталкивался с такой ситуацией. Гипотетически, если бы столкнулся - то слал бы чанками из пункта А в пункт Б, там бы это сохранял куда-нибудь на диск, к примеру. Когда полный набор данных соберется, тогда их можно уже скармливать в сфинкс. Тут еще зависит от того, что есть чанк. Некоторые могут под ним иметь ввиду реально кусок данных зашифрованный, который сам по себе не имеет никакого смысла без всех остальных чанков. А если чанк несет в себе целостные данные - то их можно сразу кормить сфинксу и выкидывать из памяти потом

Google
I
15.11.2016
09:08:15
потому что у меня на одном из проектов, где питонисты без ORM развлекались, на протобуфе+tcp такая фантастика написана, что просто капец

и там шлются асинхронными запросами как раз чанками данные

Alex
15.11.2016
09:10:37
Я кстати не смотрел насколько в ruby стримминг развит

в линухе например можно поток через пайпы расшифровать, в ноде тоже

maier
15.11.2016
09:11:05
Чанки - это кусок текста, разделенный \n для новых строк, но чанк может посередине строки отдаться

Alex
15.11.2016
09:11:16
Т.е ты как бы принимаешь шифрованный поток, оборачиваешь его расшифровщиком и дальше парсеру кормишь расшифрованные данные тоже чанками.

Чанк это кусок.

maier
15.11.2016
09:11:27
От начала строки до конца чанками его куда лучше писать

Alex
15.11.2016
09:11:46
Что значит куда? а как ты задачу решаешь?

рейк таском? джобом? вручную скрипт запускаешь?

архитектуру сам строишь.

я стриммингом в рубях не занимался но я бы написал класс под эту задачу

maier
15.11.2016
09:12:52
Вручную скрипт пишу который отдает новый tsv файл в котором пронумерованы строки, это требование сфинкса уже

Alex
15.11.2016
09:12:57
Плюс под csv уверен есть поточный парсер уже

и возможно он реализован на C

maier
15.11.2016
09:13:04
На уникальность строк

Alex
15.11.2016
09:13:41
Эксперты ?
* Пришел в чат * Ребята как сделать? * Эксперты блжад

maier
15.11.2016
09:14:05
Нафига писать про платность?

Alex
15.11.2016
09:14:25
Потому что это комплексная задаяча и тебе ее никто полностью не будет решать бесплатно

Google
Alex
15.11.2016
09:14:39
В общих чертах тебе уже подсказали, дальше надо самому копаться, тыжпрограммист.

Ну и в производительность упрешься скорее всего, я бы пересмотрел решение задачи.

maier
15.11.2016
09:15:39
Производительность чего?

Alex
15.11.2016
09:15:47
Производительность рубей.

Руби хороши для логики, скорость у них слабенькая.

maier
15.11.2016
09:16:09
Памяти, проц, i?

Io?

Alex
15.11.2016
09:16:23
Производительности интерпритатора

maier
15.11.2016
09:16:27
Чего именно

Alex
15.11.2016
09:16:37
Господи, руби медленный.

Соответственно в первую очередь это скорость аллокации в памяти и проц

maier
15.11.2016
09:17:03
Руби медленный для чего ?

I
15.11.2016
09:17:12
для много чего

для работы в целом

Alex
15.11.2016
09:17:19
Руби вообще медленный.

Просто это нивелируется тем что его не используют в тех местах где его производительности недостаточно.

I
15.11.2016
09:17:44
вот возьмешь тот же golang, простейший gin-http и возрадуешься производительности по сравнению с синатрой

Alex
15.11.2016
09:17:48
Переписывают куски на C и т.д.

Mikhail
15.11.2016
09:17:56
я вчера смотрел beego

I
15.11.2016
09:18:48
я вчера смотрел beego
https://beego.me/docs/mvc/model/overview.md На главной страничка, ведущая на 404

Google
maier
15.11.2016
09:18:50
С руби я упирался только в то, что все процы загружены, памяти не хватает или вся ширина канала забита, или на Иопс не хватает, так что в сам руби еще ни разу не упирался

Mikhail
15.11.2016
09:19:04
я завел нормально, хотя первый раз тоже промахнулся

maier
15.11.2016
09:19:17
На какой задаче ты уперся в интерпретатор руби ?

I
15.11.2016
09:19:24
да, я хочу почитать про ORM usage

и она ведет в никуда

Alex
15.11.2016
09:19:43
На какой задаче ты уперся в интерпретатор руби ?
Проц, память это и есть упереться в производительность рубей

I
15.11.2016
09:19:44
template usage too

Alex
15.11.2016
09:19:56
грубо говоря это означает что интерпритатор рубей работает медленней чем этот код написанный на языках побыстрее

Мне всегда казалось это очевидной вещью

Admin
ERROR: S client not available

Антон
15.11.2016
09:20:40
Руби вообще медленный.
не быстрый, медленный - обидно

Alex
15.11.2016
09:20:48
да, не быстрый.

Сергей
15.11.2016
09:20:51
питон же догнал

Антон
15.11.2016
09:20:53
:)

Alex
15.11.2016
09:21:00
Для поточного парсинга большого файла мне кажется не очень подойдет.

Руби вроде сравнялись с питоном по скорости, но питон тоже медленный.

I
15.11.2016
09:21:15
я понял, если открывать доки на английском, то все есть статьи)

maier
15.11.2016
09:21:21
Можешь конкретней задачу сравнение привести где руби медленнее бы работал ?

Alex
15.11.2016
09:21:38
я понял, если открывать доки на английском, то все есть статьи)
Лол, мне кажется любую документацию надо читать на английском by default.

Google
maier
15.11.2016
09:21:43
Медленнее чего опять же ))

I
15.11.2016
09:21:49
у меня по дефолту русская открылась почему-то

Антон
15.11.2016
09:21:49
да почти всего

Alex
15.11.2016
09:21:50
В русском зачастую бывает целых кусков не хватает, или устарело.

I
15.11.2016
09:21:52
я хз

I
15.11.2016
09:22:02
сперва подумал, что мб английский вообще нет

http helloword на 10к запросов будет на руби медленней

maier
15.11.2016
09:22:27
Давай практическую задачу какую нибудь комплексную

Alex
15.11.2016
09:22:49
http helloword на 10к запросов будет на руби медленней

Alex
15.11.2016
09:23:03
Чем на C/Golang

Не понимаю этого холивара, в этом чатике подавляющее большинство любят руби (я уверен) при этом они же утверждают вполне себе факт что руби не очень быстрый.

maier
15.11.2016
09:24:01
Насколько медленнее ?

I
15.11.2016
09:24:22
намного

maier
15.11.2016
09:24:36
Любят, но вопрос медленности кмк преувилечен

I
15.11.2016
09:24:46
http://take.ms/QSYdN

Alex
15.11.2016
09:24:47
http://benchmarksgame.alioth.debian.org/u64q/compare.php?lang=yarv&lang2=go

I
15.11.2016
09:25:29
ну вот если мы с рельсой сравним производительности - то разница в нагрузке 51k vs 3k

any more questions?

Alex
15.11.2016
09:25:49
Прости господи: http://benchmarksgame.alioth.debian.org/u64q/compare.php?lang=yarv&lang2=php

I
15.11.2016
09:25:58
404

а в хроме ок

Страница 616 из 1684