@ru_python

Страница 5719 из 9768
Denis
20.06.2018
04:07:13
пишу телерпам бот и он парсит много сайтов, это занимает много времени и каждый новый юзер замедляет работу. как это можно распараллелить?

Tishka17
20.06.2018
04:11:00
Да хоть celery

Google
Tishka17
20.06.2018
04:11:13
Хоть руками очередь

Nikki
20.06.2018
04:11:30
а как
Асинхронно в отдельных потоках?

Denis
20.06.2018
04:12:15
Хоть руками очередь
ну у меня сейчас 2 программы отдельных связанных через базу данных))

Tishka17
20.06.2018
04:12:23
Ну вот

Denis
20.06.2018
04:12:34
я вот по человечески решил сделать

Nikki
20.06.2018
04:15:11
Может тебе оптимизировать парсеры? Ну бд точно не выкинуть, если ты парсишь и сохраняешь для всех пользователей

Ymka
20.06.2018
04:16:27
Привет, есть спарсенные 1к статей(текст), я их очистил и закинул очищенный текст(lower, stem, etc) в dataframe. Использую TfidfVectorizer чтобы превратить текст в цифры и закинуть в байевский классификатор. Работает без проблем на сплите трейн и тест. Но когда я пытаюсь классифицировать текст из другого сайта пройдя ровно те же препроцессы, у меня .predict выдает ни один класс, как у меня было в трейн-тест сплите, а 700, при параметре в TfidfVectorizer(max_features=700). Может кто-нибудь показать где у меня неправильно?

или есть у кого-нибудь пример NLP проекта с реализацией на sklearn?

Andrew
20.06.2018
04:46:39
Ребят объясните пожалуйста, что такое Rest, и для чего эта архитектура нужна?

Andre
20.06.2018
04:47:22
Denis
20.06.2018
04:59:00
почему если код на сервере звпускать через python3 code.py всё работает а если через systemctl код подвисает

Google
Aragaer
20.06.2018
05:05:36
ты overfit получил наверняка - то есть на этой 1000 он научился выдавать правильные ответы, но зато на любом другом тексте будет сбоить

у меня есть пример, но там sklearn чуть-чуть сбоку используется и пример очень минималистичный

Denis
20.06.2018
05:09:47
Pavel
20.06.2018
05:10:12
почему если код на сервере звпускать через python3 code.py всё работает а если через systemctl код подвисает
(вангую) где-то в коде указан путь относительный путь к файлу, и при запуске через systemd он указывает не туда, куда надо?

Ymka
20.06.2018
05:10:21
можно?

у меня есть пример, но там sklearn чуть-чуть сбоку используется и пример очень минималистичный

Bohdan
20.06.2018
05:10:51
Ребят объясните пожалуйста, что такое Rest, и для чего эта архитектура нужна?
rest не существует, это фантастика есть только json-rpc и иже с ними

Denis
20.06.2018
05:10:55
и доступ идет по имени

да и ошибка бы ловилась

Pavel
20.06.2018
05:11:41
ну, тебе виднее, как ты ошибки обрабатываешь.

Denis
20.06.2018
05:11:54
ну и код то работает через обычный запуск

Aragaer
20.06.2018
05:11:55
а в логах чо пишет?

Pavel
20.06.2018
05:11:57
и доступ идет по имени
что значит эта фраза?

Aragaer
20.06.2018
05:12:00
в смысле логи от сервиса

Denis
20.06.2018
05:12:16
Pavel
20.06.2018
05:12:25
в смысле логи от сервиса
Приходит ветеринар к терапевту. Терапевт: — На что жалуетесь? Ветеринар: — Нет, ну так каждый может!

Denis
20.06.2018
05:12:45
в смысле логи от сервиса
а как их получить

Aragaer
20.06.2018
05:13:41
journalctl там

Google
Pavel
20.06.2018
05:13:44
name.db
неужели я угадал? WorkingDirectory= в .system файле пропиши с путём к твоему скрипту, что будет

Denis
20.06.2018
05:15:28
c = sqlite3.connect(database_file)

database_file = db.sqlite'

вот так оно подключается

да и нет

у меня код работает как бы

минут 5

а потом происходит таймаут на 5 минут

он засыпает и не просыпается

# sllep def call_at_interval(period, callback, args): while True: sleep(period) callback(*args) # sllep def setInterval(period, callback, *args): Thread(target=call_at_interval, args=(period, callback, args)).start()

setInterval(interval, general)

вот так он спит

Pavel
20.06.2018
05:23:03
вот так он спит
systemctl status твойсервис что показывает в это время?

Denis
20.06.2018
05:25:21
systemctl status твойсервис что показывает в это время?
он печатает то что процесс вывел в print перед засыпанием

Pavel
20.06.2018
05:26:06
Denis
20.06.2018
05:28:08
root@vz:~# systemctl status parser ● parser.service - bot 'bot Loaded: loaded (/etc/systemd/system/parser.service; en Active: active (running) since Wed 2018-06-20 00:36:45 EDT; 13min ago Main PID: 1504 (python3.6) CGroup: /system.slice/parser.service └─1504 /usr/bin/python3.6 /usr/local/bin/bots/lub Jun 20 00:37:55 vz python3.6[1504]: www Jun 20 00:37:55 vz python3.6[1504]: qqq Jun 20 00:37:55 vz python3.6[1504]: base_init--------stop--------base_init

Pavel
20.06.2018
05:35:11
¯\_(ツ)_/¯ мне кажется, нужно или обмазывать всё детальными логами, или узнавать как цеплять stdin\stdout к сервису и дебажить там, или через remote debugging разного рода.

Denis
20.06.2018
05:43:29
а чем мои функции слип лучше обычного time.sleep() в бесконечном цикле

Ymka
20.06.2018
05:57:57
есть спарсенные 1к статей(текст), я их очистил и закинул очищенный текст(lower, stem, etc) в dataframe. Использую CountVectorizer и TfidfTransformer чтобы превратить текст в цифры и закинуть в байевский классификатор. Работает без проблем на сплите трейн и тест. Но когда я пытаюсь классифицировать текст из другого сайта пройдя ровно те же препроцессы, у меня .predict выдает предсказание для каждого слова

Google
Roman
20.06.2018
08:53:34
>Design Mistakes in Node

http://tinyclouds.org/jsconf2018.pdf

Andrew
20.06.2018
08:57:03
Гугл так пишет

Admin
ERROR: S client not available

Andrew
20.06.2018
08:57:08
Что архитектура

Иван
20.06.2018
09:59:36
Народ, всем привет. Возникла проблема с python-magic. >>> from magic import Magic >>> magician = Magic(mime=True, uncompress=True, mime_encoding=True) >>> magician.from_file('/tmp/files/archives/example_multicontent_multilevel.zip') 'gzip ERROR: Stdin has more than one entry--rest ignored compressed-encoding=application/zip; charset=binary'

Кто-нибудь сталкивался? Запускается в docker, образ python:3.6-slim

Версия python-magic == 0.4.15

Tigran
20.06.2018
10:01:48
Roman
20.06.2018
10:02:37
архитектура API?
на rest есть спецификация/стандарт?

Roma
20.06.2018
10:06:39
бабин - лаборатория хакера. кто читал? как книга? там только скрипты?

?
20.06.2018
10:13:15
Привет всем

Anna
20.06.2018
10:43:58
TypeError: Parameterized generics cannot be used with class or instance checks бля, нахуя вообще тогда было добавлять статик тайпинг, если на тип даже не проверишь и на инстанс

питон такой питон

Anna
20.06.2018
10:46:28
Эт ты как вообще получил
получила: Connection = Dict[str, T] if not isinstance(params, Connection) and not isinstance(config_dst, str):

Tigran
20.06.2018
10:50:55
оупен сорс

Google
Denis
20.06.2018
10:59:24
Tigran
20.06.2018
10:59:58
таки я не согласен

Denis
20.06.2018
11:00:03
Там типизация не для этого

Likanov
20.06.2018
11:01:47
Народ, кто нибудь парсил x-thrift?

Yuri
20.06.2018
11:03:01
Ребята, если есть желающие поработать, пишите мне в директ.

Zi
20.06.2018
11:03:20
За еду*

Yuri
20.06.2018
11:03:27
Жильё

Likanov
20.06.2018
11:03:35
лал

Aragaer
20.06.2018
11:03:36
/me - нежелающий поработать

Ymka
20.06.2018
11:03:45
/me

Zi
20.06.2018
11:03:46
/me

Likanov
20.06.2018
11:03:52
/me

Страница 5719 из 9768