@botoid

Страница 1460 из 4042
?
11.09.2017
17:49:01
закомменченые места не работают

Mad
11.09.2017
17:49:14
А где тут обработка 25 урлов?

?
11.09.2017
17:49:25
ну весь код в 250 строк

мне че все кидать

Google
?
11.09.2017
17:49:37
проблема в этой части

Mad
11.09.2017
17:49:54
Какая проблема? Я уже забыл :)

Ну если мы грим про обработку 25 урлов, то проблема явно не в этой части.

А в том, как именно ты распараллелил обработку этих урлов.

?
11.09.2017
17:50:30
в обработке их и не было проблемы

Mad
11.09.2017
17:50:39
Ну ок :D

?
11.09.2017
17:50:39
видишь код?

Mad
11.09.2017
17:50:47
Вижу

Но хочу развидеть :D

Ща напишу, как бы это на Grab выглядело

?
11.09.2017
17:51:56
не надо

Mad
11.09.2017
17:54:28
Да, я уже тоже решил не постить, стока же кода получается.

Но юзать сначала urllib.request, а потом requests это как-то странно

Google
?
11.09.2017
17:57:33
Но юзать сначала urllib.request, а потом requests это как-то странно
потому что через первый фото не открывается

редиректит на заглушку

Mad
11.09.2017
17:57:45
https://dumpz.org/2699264/ как-то так

Ну дык и юзай везде requests, зачем ты миксуешь разные либы.

?
11.09.2017
18:15:43
почему magnet = html.xpath('//*[@id="tor-hash"]')

выводит всю страницу

Mad
11.09.2017
18:16:19
оно не может выводить всю страницу, это операция присваивания переменной

?
11.09.2017
18:16:33
не

бля

это понятно

почему в магнет вся страница

Mad
11.09.2017
18:21:53
там не может быть всей страницы, там ваще список у тебя должен быть :)

т.к. xpath список возвращает

Илил что такое html?

ElementTree?

Marlik
11.09.2017
18:30:14
выводит всю страницу
Наверное не прально ищешь ид.

Mad
11.09.2017
18:31:37
Я думаю, он там что-то жёстко перепутал т.к. xpath список возвращает, плюс такой xpath не может вернуть "всю страницу", что бы это ни значило

?
11.09.2017
18:48:00
уже не вся страница а []

Marlik
11.09.2017
18:50:10
А cpan не нуно указывать? Я прост по памяти, уже и не помню.

Google
Kiku
11.09.2017
18:51:20
о а что ты делаешь?

Marlik
11.09.2017
18:52:05
Парсит страницу.

Mad
11.09.2017
18:58:00
На самом деле проще один раз распарсить все страницы рутрекера и потом подпарсивать по необходимости. Бот будет работать моментально -)

Vaderoff
11.09.2017
18:59:01
уже не вся страница а []
А ты досих пор еще с этим ботом паришься

?
11.09.2017
18:59:17
а то он умер

Vaderoff
11.09.2017
18:59:59
я его пытаюсь переписать
Ох лучше б ты бухал

?
11.09.2017
19:05:59
я не понимаю почему переменная обнуляется

Marlik
11.09.2017
19:10:38
Она не обнуляется, ты не так ищешь, и она не находит.

?
11.09.2017
19:13:18
Она не обнуляется, ты не так ищешь, и она не находит.
через консоль хрома все находится

Marlik
11.09.2017
19:13:33
Не верь хрому.

?
11.09.2017
19:13:36


Marlik
11.09.2017
19:14:49
Ща гляну, в старом коде как искал...

my $nb = $tree->findnodes("/html/body//div[\@class=\"text\"]");

?
11.09.2017
19:18:03
Marlik
11.09.2017
19:18:18
Великий и могучий Perl.

Но это тоже через XPath

Карабанов
11.09.2017
19:18:37
?

Mad
11.09.2017
19:19:18
Это какой-то люто бессмысленный xpath

Можно проще ;) findnodes("//div[@class=\"text\"]")

Google
Marlik
11.09.2017
19:20:46
Наверное можно и так, старый код, до сих пор работает, а что работает лучше не трогать.

?
11.09.2017
19:20:54
(Hard Rock) [MC] [24/88.2] AC/DC - Dirty Deeds Done Dirt Cheap - 1976, WavPack (image+.cue)​ Категория: Зарубежная рок-музыка (оцифровки) Размер: 822.2 MB []

?

Sergey❄️
11.09.2017
19:21:23
Herokuapp

Bggg

Карабанов
11.09.2017
19:21:42
?

Admin
ERROR: S client not available

?
11.09.2017
19:22:34
Herokuapp
ой еще домен покупать

идите вы

Карабанов
11.09.2017
19:23:06
либо нет?

Sergey❄️
11.09.2017
19:23:14
ой еще домен покупать
Бесплатный гитхаба :^)

?
11.09.2017
19:23:33
Бесплатный гитхаба :^)
зачем, если в хероку и так есть

любители костылей(

Marlik
11.09.2017
19:23:53
Можно проще ;) findnodes("//div[@class=\"text\"]")
Не, так не буит работать.

Mad
11.09.2017
19:24:02
Будет

Ну или у тебя там XPATH движок кривой

Я в переле не шарю

Marlik
11.09.2017
19:25:06
my $tree = HTML::TreeBuilder::XPath->new; my $ua = LWP::UserAgent->new; my $page = $ua->get("$key")->decoded_content; $tree->parse($page); my $nb = $tree->findnodes("/html/body//div[\@class=\"text\"]"); $text = $nb->[0]->as_HTML("<>&"); $text =~ s/<.*?>/ /gi;

Mad
11.09.2017
19:25:43
Шикарно, да

Зачем ты @ экранируешь?

Google
Mad
11.09.2017
19:26:31
Или в перле строки компилируются?

Marlik
11.09.2017
19:26:55
Потому что perl.

Mad
11.09.2017
19:27:22
Ну типа, если бы не заэкранировал, то он попытался бы подставить значение переменной @class, так?

Вернее это массив, насколько я помню

Marlik
11.09.2017
19:27:35
$ @ % спецсимволы

Mad
11.09.2017
19:27:54
Ну так внутри строки же

Да, вижу, беда, если не экранировать.

Marlik
11.09.2017
19:29:39
Плин, просто поверь, например что-бы выдать имя бота @BotName в коде, нуно экранировать \@BotName ибо perl выдаст ошибку, что такого массива нет.

Mad
11.09.2017
19:30:03
Ну дык я верю, я выше тебя это и спрашивал -)

Marlik
11.09.2017
19:55:42
Я же тебе говорил, попробуй span в путь добавить.

Mad
11.09.2017
19:57:27
* включает в себя span, если шо

Marlik
11.09.2017
19:58:22
ну хз тада...

?
11.09.2017
20:00:16
да че ж все так трудно то

?
11.09.2017
20:01:24
запарсить страницу

парсил через bs4

сказали что на lxml проще

перешел и ничо не работает

Marlik
11.09.2017
20:03:36
XPath доку то почитай, да и вообще всегда читай доку, плюс исходники либ.

Страница 1460 из 4042