
?
11.09.2017
17:49:01
закомменченые места не работают

Mad
11.09.2017
17:49:14
А где тут обработка 25 урлов?

?
11.09.2017
17:49:25
ну весь код в 250 строк
мне че все кидать

Google

?
11.09.2017
17:49:37
проблема в этой части

Mad
11.09.2017
17:49:54
Какая проблема? Я уже забыл :)
Ну если мы грим про обработку 25 урлов, то проблема явно не в этой части.
А в том, как именно ты распараллелил обработку этих урлов.

?
11.09.2017
17:50:30
в обработке их и не было проблемы

Mad
11.09.2017
17:50:39
Ну ок :D

?
11.09.2017
17:50:39
видишь код?

Mad
11.09.2017
17:50:47
Вижу
Но хочу развидеть :D
Ща напишу, как бы это на Grab выглядело

?
11.09.2017
17:51:56
не надо

Mad
11.09.2017
17:54:28
Да, я уже тоже решил не постить, стока же кода получается.
Но юзать сначала urllib.request, а потом requests это как-то странно

Google

?
11.09.2017
17:57:33
редиректит на заглушку

Mad
11.09.2017
17:57:45
https://dumpz.org/2699264/ как-то так
Ну дык и юзай везде requests, зачем ты миксуешь разные либы.

?
11.09.2017
18:15:43
почему magnet = html.xpath('//*[@id="tor-hash"]')
выводит всю страницу

Mad
11.09.2017
18:16:19
оно не может выводить всю страницу, это операция присваивания переменной

?
11.09.2017
18:16:33
не
бля
это понятно
почему в магнет вся страница

Mad
11.09.2017
18:21:53
там не может быть всей страницы, там ваще список у тебя должен быть :)
т.к. xpath список возвращает
Илил что такое html?
ElementTree?

Marlik
11.09.2017
18:30:14

Mad
11.09.2017
18:31:37
Я думаю, он там что-то жёстко перепутал т.к. xpath список возвращает, плюс такой xpath не может вернуть "всю страницу", что бы это ни значило

?
11.09.2017
18:48:00
уже не вся страница а []

Marlik
11.09.2017
18:50:10
А cpan не нуно указывать? Я прост по памяти, уже и не помню.

Google

Kiku
11.09.2017
18:51:20
о а что ты делаешь?

Marlik
11.09.2017
18:52:05
Парсит страницу.

Mad
11.09.2017
18:58:00
На самом деле проще один раз распарсить все страницы рутрекера и потом подпарсивать по необходимости. Бот будет работать моментально -)

Vaderoff
11.09.2017
18:59:01

?
11.09.2017
18:59:17
а то он умер

Vaderoff
11.09.2017
18:59:59

?
11.09.2017
19:05:59
я не понимаю почему переменная обнуляется

Marlik
11.09.2017
19:10:38
Она не обнуляется, ты не так ищешь, и она не находит.

?
11.09.2017
19:13:18

Marlik
11.09.2017
19:13:33
Не верь хрому.

?
11.09.2017
19:13:36

Marlik
11.09.2017
19:14:49
Ща гляну, в старом коде как искал...
my $nb = $tree->findnodes("/html/body//div[\@class=\"text\"]");

?
11.09.2017
19:18:03

Marlik
11.09.2017
19:18:18
Великий и могучий Perl.
Но это тоже через XPath

Карабанов
11.09.2017
19:18:37
?

Mad
11.09.2017
19:19:18
Это какой-то люто бессмысленный xpath
Можно проще ;)
findnodes("//div[@class=\"text\"]")

Google

Marlik
11.09.2017
19:20:46
Наверное можно и так, старый код, до сих пор работает, а что работает лучше не трогать.

?
11.09.2017
19:20:54
(Hard Rock) [MC] [24/88.2] AC/DC - Dirty Deeds Done Dirt Cheap - 1976, WavPack (image+.cue)
Категория: Зарубежная рок-музыка (оцифровки)
Размер: 822.2 MB
[]
?

Sergey❄️
11.09.2017
19:21:23
Herokuapp
Bggg

Карабанов
11.09.2017
19:21:42
?

Admin
ERROR: S client not available

?
11.09.2017
19:22:34
идите вы

Карабанов
11.09.2017
19:23:06
либо нет?

Sergey❄️
11.09.2017
19:23:14

?
11.09.2017
19:23:33
любители костылей(

Marlik
11.09.2017
19:23:53

Mad
11.09.2017
19:24:02
Будет
Ну или у тебя там XPATH движок кривой
Я в переле не шарю

Marlik
11.09.2017
19:25:06
my $tree = HTML::TreeBuilder::XPath->new;
my $ua = LWP::UserAgent->new;
my $page = $ua->get("$key")->decoded_content;
$tree->parse($page);
my $nb = $tree->findnodes("/html/body//div[\@class=\"text\"]");
$text = $nb->[0]->as_HTML("<>&");
$text =~ s/<.*?>/ /gi;

Mad
11.09.2017
19:25:43
Шикарно, да
Зачем ты @ экранируешь?

Google

Mad
11.09.2017
19:26:31
Или в перле строки компилируются?

Marlik
11.09.2017
19:26:55
Потому что perl.

Mad
11.09.2017
19:27:22
Ну типа, если бы не заэкранировал, то он попытался бы подставить значение переменной @class, так?
Вернее это массив, насколько я помню

Marlik
11.09.2017
19:27:35
$ @ % спецсимволы

Mad
11.09.2017
19:27:54
Ну так внутри строки же
Да, вижу, беда, если не экранировать.

Marlik
11.09.2017
19:29:39
Плин, просто поверь, например что-бы выдать имя бота @BotName в коде, нуно экранировать \@BotName ибо perl выдаст ошибку, что такого массива нет.

Mad
11.09.2017
19:30:03
Ну дык я верю, я выше тебя это и спрашивал -)

Marlik
11.09.2017
19:55:42
Я же тебе говорил, попробуй span в путь добавить.

Mad
11.09.2017
19:57:27
* включает в себя span, если шо

Marlik
11.09.2017
19:58:22
ну хз тада...

?
11.09.2017
20:00:16
да че ж все так трудно то

Oleg
11.09.2017
20:00:44

?
11.09.2017
20:01:24
запарсить страницу
парсил через bs4
сказали что на lxml проще
перешел и ничо не работает

Marlik
11.09.2017
20:03:36
XPath доку то почитай, да и вообще всегда читай доку, плюс исходники либ.