
Anna
23.10.2016
20:34:47
обожэ, это так сложно, когда один юзернейм на все сети

Yuryhalf
23.10.2016
20:35:07
в бм даже этого не знают,поверь))
в амстер хочу вот сгонят
шенген над открыть

Google

Yuryhalf
23.10.2016
20:39:01
в чехии в прошлом году увидел BTС банкоматы
и завис

Letalis
23.10.2016
21:08:18
Господа, а может такое быть, что при работающей кодировке 65001 (utf-8) , русский текст все равно предстает в PowerShell (и cmd) в виде кракозябр?

Zart
23.10.2016
21:09:21
смотря откуда взялся
многие программы игнорят кодировку консоли

Letalis
23.10.2016
21:10:04
ну, делаю парсер, он достает из lenta.ru ссылки-заголовки и должен по идее из возвращать ,но вместо них выдает, ща покажу что

Igor
23.10.2016
21:10:37
парсер на bs4? попробуй там указать кодировку насильно

Zart
23.10.2016
21:10:41
хуита
зачем кстати делать это в пс?

Letalis
23.10.2016
21:11:09
def parse_courses():
f = urlopen(URL)
list_html = f.read().decode('utf-8')
list_doc = fromstring(list_html)
for elem in list_doc.cssselect(ITEM_PATH):
a = elem.cssselect('a')[0]
href = a.get('href')
name = a.text
print(name)
вот част ькода
тут utf-8

Zart
23.10.2016
21:11:19
он как шелл для команд - говно

Google

Letalis
23.10.2016
21:11:24
и на сайте, и в пш
а оно и в cmd так же

Igor
23.10.2016
21:11:48
зачем decode utf8?

Letalis
23.10.2016
21:12:24
хз, чувак из вебинара так сделал. Ну на сайте (лента.ру) такая стоит, напрмиер. Не надо это указывать? Он особо это тмомент не пояснял

Zart
23.10.2016
21:12:43
смотря чем парсишь

Igor
23.10.2016
21:12:55
судя по fromstring, lxml

Letalis
23.10.2016
21:13:08
from urllib.request import urlopen
from urllib.parse import urljoin
from lxml.html import fromstring
URL = 'https://lenta.ru/'
ITEM_PATH = '.item '
#заходит на страницу, выкатывает содержимое
#во внуттенние данные питона
def parse_courses():
f = urlopen(URL)
list_html = f.read().decode('utf-8')
list_doc = fromstring(list_html)
for elem in list_doc.cssselect(ITEM_PATH):
a = elem.cssselect('a')[0]
href = a.get('href')
name = a.text
print(name)
def main():
parse_courses()
if __name__ == '__main__':
main()
вот целиком
lxml, видимо

Zart
23.10.2016
21:13:39
ммм

Letalis
23.10.2016
21:14:36
если сделать print(href) то все норм, ссылки выводит, но они на английском.

Zart
23.10.2016
21:14:49
воткни принт list_html[:100] и проверь
неуверен что лента утф отдает

Stanislav
23.10.2016
21:15:28

Letalis
23.10.2016
21:15:48
я пока раз 6 запустил, за последний час - эт много?

Zart
23.10.2016
21:16:13
хуйлоад™

Igor
23.10.2016
21:16:36
и юзерагента бы сменить на нормальный браузер хотя бы

Letalis
23.10.2016
21:16:48
PS D:\python> python parser.py
<!DOCTYPE html><html data-class-hidden="g-hidden"><head>
<title>Lenta.ru</title><meta content="text/
<!DOCTYPE html><html data-class-hidden="g-hidden"><head>
<title>Lenta.ru</title><meta content="text/

Johnnie
23.10.2016
21:16:51
Бля, почему груб перестал хотеть грузить Винду?

Igor
23.10.2016
21:17:00

Google

Letalis
23.10.2016
21:17:05
и так много-много раз

Igor
23.10.2016
21:17:14

Johnnie
23.10.2016
21:17:28
Поставил 7, поставил арч
Поставил os-prober
Раньше также делал

Yuryhalf
23.10.2016
21:17:52
<title>Lenta.ru</title><meta content="text/html; charset=utf-8" http-equiv="Content-Type" />

Letalis
23.10.2016
21:17:59
кстати да, я же в цикл его сунул)

Johnnie
23.10.2016
21:18:07
После установки арча не хочет грузить винду

Igor
23.10.2016
21:18:12
забавно, походу в терминале у тебя не юникод

Yuryhalf
23.10.2016
21:18:24
utf-8 на ленте жи

Igor
23.10.2016
21:18:37

Letalis
23.10.2016
21:18:51
PS D:\python> python parser.py
<!DOCTYPE html><html data-class-hidden="g-hidden"><head>
<title>Lenta.ru</title><meta content="text/

Letalis
23.10.2016
21:18:56
на ленте да utf-8

Johnnie
23.10.2016
21:19:01

Letalis
23.10.2016
21:19:01
и я декодю туда ж

Zart
23.10.2016
21:19:04
два активных раздела. ну и мудак

Letalis
23.10.2016
21:19:05
и в ПШ 65001
в ПШ я сделал chcp 65001
и все равно там ерунда выводится
кстати, если сделать chcp 1251 то тоже кракозябры ток другие чуток)

Google

Igor
23.10.2016
21:19:58
а ты через sp -t d HKCU:\Console CodePage 0xfde9 делал?

Letalis
23.10.2016
21:20:18
PS D:\python> chcp 1251
Текущая кодовая страница: 1251
PS D:\python>

Zart
23.10.2016
21:20:20

Igor
23.10.2016
21:20:22
или CHCP 65001?

Letalis
23.10.2016
21:20:25
забавно а сюда копируется рус. буквы

Igor
23.10.2016
21:20:32

Zart
23.10.2016
21:20:59
а, сетпроперти

Admin
ERROR: S client not available

Stanislav
23.10.2016
21:21:02

Zart
23.10.2016
21:21:14
бармина

Johnnie
23.10.2016
21:21:22

Igor
23.10.2016
21:21:27
брамина

Letalis
23.10.2016
21:21:28
я так понимаю у меня с ПШ пробелмы

Zart
23.10.2016
21:21:50
утф8 в винде - хуевая идея обычно

Stanislav
23.10.2016
21:22:00
Фоллыч

Anna
23.10.2016
21:22:29
слышь, мне что, опять проходить теперь из-за тебя?

Igor
23.10.2016
21:22:34
не благодари!

Letalis
23.10.2016
21:22:52

Google

Igor
23.10.2016
21:23:02

Anna
23.10.2016
21:23:09
у меня ведь где-то в загашниках на ГОГе лицензионный куплен...

Johnnie
23.10.2016
21:23:28
С флагом должен быть только раздел, куда ставится груб?

Anna
23.10.2016
21:23:42

Yuryhalf
23.10.2016
21:23:55
https://scontent.xx.fbcdn.net/v/t1.0-9/14670669_608568482638016_7092987549262861569_n.jpg?oh=1b4709e787fd33cce82c53bc6424866a&oe=58ACEB23

Zart
23.10.2016
21:23:56

Letalis
23.10.2016
21:24:04

Zart
23.10.2016
21:24:11

Igor
23.10.2016
21:24:14

Yuryhalf
23.10.2016
21:24:34

Johnnie
23.10.2016
21:24:38
нет
А как? Мне казалось что именно в таком виде работало

Letalis
23.10.2016
21:24:51

Yuryhalf
23.10.2016
21:25:04

Letalis
23.10.2016
21:25:06
не
я бегиннер не только в питоне а вообще
прост ос питона начал вот
жил себе и жил, а оказалось что столько подводных камней с этим виндовс
Эта группа больше не существует