
Alex
08.02.2017
16:15:20
привет мужики
помогите найти ошибку в парсере https://github.com/antauren/parsing/blob/master/weblancer.net.py
если задать количество страниц вручную до 8 то ошибок нет

Denis
08.02.2017
16:30:10
[21:-15]
Не надо так

Alex
08.02.2017
16:34:01
Не надо так
почему, так я нахожу номер последней страницы - 187, он ее точно определяет

Google

Denis
08.02.2017
16:34:16
А в чем проблема?

Petr
08.02.2017
16:37:05
asyncio или multiprocessing, что эффективнее?

Alex
08.02.2017
16:38:21
А в чем проблема?
ошибка при запуске кода
если в коде закоментировать строку 46, где я определяю количество страниц вручную, то будет ошибка
если устновить 8 страниц то нет ошибки, если 9 то есть
page_count = 9 #если задать количество страниц вручную до 8 то ошибок нет

Denis
08.02.2017
16:38:38

Petr
08.02.2017
16:39:43
Многопоточный вылидатор работает по TCP

Denis
08.02.2017
16:41:04
Что такое вылидатор?

Alex
08.02.2017
16:41:10
У ошибки есть название?
Traceback (most recent call last):
File "C:/Projects/weblancer.net.py", line 60, in <module>
main()
File "C:/Projects/weblancer.net.py", line 49, in main
jobs.extend( parse( get_html(BASE_URL + '?page=%d' % page) ) )
File "C:/Projects/weblancer.net.py", line 31, in parse
'categories': categories[0].a.text,
AttributeError: 'NoneType' object has no attribute 'text'

Denis
08.02.2017
16:42:08
Нет там текста

Petr
08.02.2017
16:42:50

Denis
08.02.2017
16:43:30
Я бы сказал, что threading быстрее будет, но это не точно
Лучше проверь

Petr
08.02.2017
16:44:25

Google

Alex
08.02.2017
16:45:01
Нет там текста
на какой то из страниц, например 9, парсер не может заполнить переменную категория
ну и как решать, через try except?

Petr
08.02.2017
16:45:02
ТАм же как бы переключение между ними через тики, а так вообще отдельные процессы

Denis
08.02.2017
16:45:38
Процессы тяжелее потоков

Petr
08.02.2017
16:48:27

Sergey
08.02.2017
16:52:07
Судя по комменту поправил ошибку?

Denis
08.02.2017
16:57:35

Petr
08.02.2017
16:58:40
Ну типо соединения по TCP

Denis
08.02.2017
17:05:08
У тебя либо несколько потоков с блокирующими сокетами, либо ивент луп с неблокирующими. Зачем их совмещать?

Ilya
08.02.2017
17:14:23
Ну типо соединения по TCP
Имеет смысл асинк использовать для связи с другими сервисами а процессы/треды для внутренней обработки

Never
08.02.2017
17:20:42
Помогите плс, ф-ция sort() в питоне какую сортировку использует? ну там слиянием или вставкой или что...

53r63rn4r
08.02.2017
17:21:59

Never
08.02.2017
17:25:15

53r63rn4r
08.02.2017
17:25:20
Da

Max
08.02.2017
17:31:57
Как строится API для django?

b0g3r
08.02.2017
17:38:48

53r63rn4r
08.02.2017
17:41:40
django-rest-framework

Скрудж
08.02.2017
17:43:23
Вечер в хату. Работаю с selenium, в нем использую > 100 сессий, которые, на данный момент, работают по типу 1 сессия = 1 окно браузера. Есть ли смысл писать такую фичу, типо хранить кукисы сессии, а когда происходит обращение к сессии какой-то, то она запускает браузер, устанавливает свои кукисы, выполняет запрос и закрывает браузер? Много ли памяти сэкономит? или лучше в пользу скорости смотреть?

53r63rn4r
08.02.2017
17:50:04
Ну, если ты работаешь с теми же сайтами, то нормально

Google

Скрудж
08.02.2017
17:52:28

Pavel
08.02.2017
17:58:02
двести окон браузера одновременно - это цпу и память, одно окно туда/сюда дёргать - это время. И чего у тебя больше, а чего не хватает, ответить можешь только ты сам.

sairusvirus
08.02.2017
18:07:05
С чего питон изучать начать

Yan?
08.02.2017
18:07:20
написать cloud SaaS

Alex
08.02.2017
18:07:36

Проксимов
08.02.2017
18:07:39

Скрудж
08.02.2017
18:07:44
Окей, с этим я понял. А в selenium можно использовать прокси с авторизацией через username password? Если да, то покажите пример, пожалуйста

sairusvirus
08.02.2017
18:08:04
Я читал лунца читал долго а дальше что

Скрудж
08.02.2017
18:08:11
На стеке пишут, что нужно какой-то zip делать

53r63rn4r
08.02.2017
18:08:35
Чего ливнуть?

sairusvirus
08.02.2017
18:08:55
Ну базару нет он пишет слишком подробно как для даунов

@AliVerTheItasIa
08.02.2017
18:08:56

Проксимов
08.02.2017
18:09:01

@AliVerTheItasIa
08.02.2017
18:09:01
Отсюда..

Скрудж
08.02.2017
18:09:18

Проксимов
08.02.2017
18:09:19
В интересующей области

sairusvirus
08.02.2017
18:09:58
Может кто по логике подскажет книгу а то я как понял без логики некуда

@AliVerTheItasIa
08.02.2017
18:10:23

Скрудж
08.02.2017
18:10:41
Пля, да помогите мне лучше ><

Google

sairusvirus
08.02.2017
18:12:25
Мож кто возьмет меня на стажировку
Буду на халяву писать

Скрудж
08.02.2017
18:12:55
иди пейнт сделай свой, сразу питон весь выучишь

Темный
08.02.2017
18:14:08
- мне не помогают, значит никому не помогайте!

@AliVerTheItasIa
08.02.2017
18:14:50

Скрудж
08.02.2017
18:14:52

Admin
ERROR: S client not available

@AliVerTheItasIa
08.02.2017
18:14:53
...

Сергей
08.02.2017
18:15:00

Скрудж
08.02.2017
18:15:07

Сергей
08.02.2017
18:16:54
Я читал лунца читал долго а дальше что
Выбрать направление и опять читать.. Примерно что то получаться начнёт - искать работу.. Сам по себе python это одно, а в любом направлении куча специфичного...

@AliVerTheItasIa
08.02.2017
18:17:50

sairusvirus
08.02.2017
18:18:31
Хотел для себя чисто чтобы автоматизировать рутину парсинг обработку данных и прочее
Как никак вручную шлак всякий делать не вариант нах тогда комп вообще нужен

Сергей
08.02.2017
18:19:25

sairusvirus
08.02.2017
18:21:01
Видать надо логику и алгоритмы подтянуть чтоб в башке порядок был и можно было четко по порядку писать код а не кидаться сразу во все подряд

@AliVerTheItasIa
08.02.2017
18:22:01

Сергей
08.02.2017
18:22:12
Идеальный код == миф

Google

sairusvirus
08.02.2017
18:22:19
Так книгу подкиньте по логике

Скрудж
08.02.2017
18:22:31

@AliVerTheItasIa
08.02.2017
18:22:42

sairusvirus
08.02.2017
18:23:09
Да хотя б знать буду куда двигаться как это все грамотно делать

@AliVerTheItasIa
08.02.2017
18:23:40
Нужно просто писать.
Просто... Писать...
Код

Сергей
08.02.2017
18:24:34

sairusvirus
08.02.2017
18:25:09
И еще я как понял без знания английского ваще печально будет

@AliVerTheItasIa
08.02.2017
18:25:15

Сергей
08.02.2017
18:26:10

Скрудж
08.02.2017
18:26:23
это уже не python beginners, это уже нахуй python dayns

sairusvirus
08.02.2017
18:27:42
Да мне 27 почти
Видать мозг не такой шустрый как в молодости
Туго идет

Pavel
08.02.2017
18:28:24
что ты знаешь о старости, мальчик...

Скрудж
08.02.2017
18:29:36

sairusvirus
08.02.2017
18:30:11
Даун это тот кто заказывает скрипты примитивные
Эта группа больше не существует