
Denis
20.06.2018
04:07:13
пишу телерпам бот и он парсит много сайтов, это занимает много времени и каждый новый юзер замедляет работу. как это можно распараллелить?

Andre
20.06.2018
04:09:27

Denis
20.06.2018
04:10:11

Tishka17
20.06.2018
04:11:00
Да хоть celery

Google

Tishka17
20.06.2018
04:11:13
Хоть руками очередь

Nikki
20.06.2018
04:11:30
а как
Асинхронно в отдельных потоках?

Denis
20.06.2018
04:12:15

Tishka17
20.06.2018
04:12:23
Ну вот

Denis
20.06.2018
04:12:34
я вот по человечески решил сделать

Nikki
20.06.2018
04:15:11
Может тебе оптимизировать парсеры? Ну бд точно не выкинуть, если ты парсишь и сохраняешь для всех пользователей

Ymka
20.06.2018
04:16:27
Привет, есть спарсенные 1к статей(текст), я их очистил и закинул очищенный текст(lower, stem, etc) в dataframe. Использую TfidfVectorizer чтобы превратить текст в цифры и закинуть в байевский классификатор. Работает без проблем на сплите трейн и тест. Но когда я пытаюсь классифицировать текст из другого сайта пройдя ровно те же препроцессы, у меня .predict выдает ни один класс, как у меня было в трейн-тест сплите, а 700, при параметре в TfidfVectorizer(max_features=700). Может кто-нибудь показать где у меня неправильно?
или есть у кого-нибудь пример NLP проекта с реализацией на sklearn?

Andrew
20.06.2018
04:46:39
Ребят объясните пожалуйста, что такое Rest, и для чего эта архитектура нужна?

Andre
20.06.2018
04:47:22

Denis
20.06.2018
04:59:00
почему если код на сервере звпускать через python3 code.py всё работает а если через systemctl код подвисает

Aragaer
20.06.2018
05:04:19
ну и плюс 1000 это мало, тем более если фичей целых 700

Google

Aragaer
20.06.2018
05:05:36
ты overfit получил наверняка - то есть на этой 1000 он научился выдавать правильные ответы, но зато на любом другом тексте будет сбоить
у меня есть пример, но там sklearn чуть-чуть сбоку используется и пример очень минималистичный

Проксимов
20.06.2018
05:06:55

Denis
20.06.2018
05:09:47

Pavel
20.06.2018
05:10:12

Ymka
20.06.2018
05:10:21
можно?
у меня есть пример, но там sklearn чуть-чуть сбоку используется и пример очень минималистичный

Bohdan
20.06.2018
05:10:51

Denis
20.06.2018
05:10:55
и доступ идет по имени
да и ошибка бы ловилась

Pavel
20.06.2018
05:11:41
ну, тебе виднее, как ты ошибки обрабатываешь.

Denis
20.06.2018
05:11:54
ну и код то работает через обычный запуск

Aragaer
20.06.2018
05:11:55
а в логах чо пишет?

Pavel
20.06.2018
05:11:57

Aragaer
20.06.2018
05:12:00
в смысле логи от сервиса

Denis
20.06.2018
05:12:16

Pavel
20.06.2018
05:12:25
в смысле логи от сервиса
Приходит ветеринар к терапевту.
Терапевт:
— На что жалуетесь?
Ветеринар:
— Нет, ну так каждый может!

Denis
20.06.2018
05:12:45

Aragaer
20.06.2018
05:13:41
journalctl там

Google

Pavel
20.06.2018
05:13:44
name.db
неужели я угадал?
WorkingDirectory= в .system файле пропиши с путём к твоему скрипту, что будет

Denis
20.06.2018
05:15:28
c = sqlite3.connect(database_file)
database_file = db.sqlite'
вот так оно подключается
да и нет
у меня код работает как бы
минут 5
а потом происходит таймаут на 5 минут
он засыпает и не просыпается
# sllep
def call_at_interval(period, callback, args):
while True:
sleep(period)
callback(*args)
# sllep
def setInterval(period, callback, *args):
Thread(target=call_at_interval, args=(period, callback, args)).start()
setInterval(interval, general)
вот так он спит

Pavel
20.06.2018
05:23:03

Denis
20.06.2018
05:25:21

Pavel
20.06.2018
05:26:06

Denis
20.06.2018
05:28:08
root@vz:~# systemctl status parser
● parser.service - bot 'bot
Loaded: loaded (/etc/systemd/system/parser.service; en
Active: active (running) since Wed 2018-06-20 00:36:45 EDT; 13min ago
Main PID: 1504 (python3.6)
CGroup: /system.slice/parser.service
└─1504 /usr/bin/python3.6 /usr/local/bin/bots/lub
Jun 20 00:37:55 vz python3.6[1504]: www
Jun 20 00:37:55 vz python3.6[1504]: qqq
Jun 20 00:37:55 vz python3.6[1504]: base_init--------stop--------base_init

Pavel
20.06.2018
05:35:11
¯\_(ツ)_/¯ мне кажется, нужно или обмазывать всё детальными логами, или узнавать как цеплять stdin\stdout к сервису и дебажить там, или через remote debugging разного рода.

Denis
20.06.2018
05:43:29
а чем мои функции слип лучше обычного time.sleep() в бесконечном цикле

Ymka
20.06.2018
05:57:57
есть спарсенные 1к статей(текст), я их очистил и закинул очищенный текст(lower, stem, etc) в dataframe. Использую CountVectorizer и TfidfTransformer чтобы превратить текст в цифры и закинуть в байевский классификатор. Работает без проблем на сплите трейн и тест. Но когда я пытаюсь классифицировать текст из другого сайта пройдя ровно те же препроцессы, у меня .predict выдает предсказание для каждого слова

Google

Roman
20.06.2018
08:53:34
>Design Mistakes in Node
http://tinyclouds.org/jsconf2018.pdf

Andrew
20.06.2018
08:57:03
Гугл так пишет

Admin
ERROR: S client not available

Andrew
20.06.2018
08:57:08
Что архитектура

Иван
20.06.2018
09:59:36
Народ, всем привет. Возникла проблема с python-magic.
>>> from magic import Magic
>>> magician = Magic(mime=True, uncompress=True, mime_encoding=True)
>>> magician.from_file('/tmp/files/archives/example_multicontent_multilevel.zip')
'gzip ERROR: Stdin has more than one entry--rest ignored compressed-encoding=application/zip; charset=binary'
Кто-нибудь сталкивался? Запускается в docker, образ python:3.6-slim
Версия python-magic == 0.4.15

Tigran
20.06.2018
10:01:48

Roman
20.06.2018
10:02:37

Roma
20.06.2018
10:06:39
бабин - лаборатория хакера. кто читал? как книга? там только скрипты?

?
20.06.2018
10:13:15
Привет всем

Anna
20.06.2018
10:43:58
TypeError: Parameterized generics cannot be used with class or instance checks бля, нахуя вообще тогда было добавлять статик тайпинг, если на тип даже не проверишь и на инстанс
питон такой питон

Маришка
20.06.2018
10:45:13

Tigran
20.06.2018
10:46:06

Anna
20.06.2018
10:46:28
Эт ты как вообще получил
получила: Connection = Dict[str, T] if not isinstance(params, Connection) and not isinstance(config_dst, str):

Tigran
20.06.2018
10:50:55
оупен сорс

Google

Denis
20.06.2018
10:59:24

Tigran
20.06.2018
10:59:58
таки я не согласен

Denis
20.06.2018
11:00:03
Там типизация не для этого

Likanov
20.06.2018
11:01:47
Народ, кто нибудь парсил x-thrift?

Yuri
20.06.2018
11:03:01
Ребята, если есть желающие поработать, пишите мне в директ.

Zi
20.06.2018
11:03:20
За еду*

Yuri
20.06.2018
11:03:27
Жильё

Likanov
20.06.2018
11:03:35
лал

Aragaer
20.06.2018
11:03:36
/me - нежелающий поработать

Ymka
20.06.2018
11:03:45
/me

Zi
20.06.2018
11:03:46
/me

Likanov
20.06.2018
11:03:52
/me