@ru_python

Страница 8587 из 9768
Tishka17
01.04.2019
11:39:16
Пробну, спасибо
Собственно, что Алик тебе и объясняет

Worlak
01.04.2019
11:39:21
поэтому либо парсишь контент, либо надеешься на chardet.
В заголовке передаётся и я ее спарсиваю

Alex
01.04.2019
11:40:34
ну вот если requests тебе не делает декод автоматом, ты должен сам его сделать.

Tishka17
01.04.2019
11:40:43
Ну значит у себя в шаблоне смотри, что ты выдаёшь

Google
Tishka17
01.04.2019
11:41:06
И вообще, минимальный код в студию

Alex
01.04.2019
11:41:09
и потом на выходе уже encode в нужную кодировку (не исходную, а ту в которой ты результат отдаешь)

лучше в utf-8

везде используй UTF-8

Worlak
01.04.2019
11:41:36
Пару минут, модем подрублю и поскидываю

Tishka17
01.04.2019
11:42:39
Andrew
01.04.2019
11:45:18
Пора уже глоссарий заебашить с решением типовых вопросов

Worlak
01.04.2019
11:55:09
вот такой кусок во тчто выводит

Aragaer
01.04.2019
11:57:51
а зачем сначала decode, а потом encode сразу?

Worlak
01.04.2019
11:58:07
а зачем сначала decode, а потом encode сразу?
бьется и ругается что не может

any
01.04.2019
11:58:21
Мне бы ваши проблемы..

Aragaer
01.04.2019
11:58:30
а просто сделать decode и на этом успокоиться?

только без str

Google
Aragaer
01.04.2019
11:58:57
и вообще, какой тип у html?

Worlak
01.04.2019
11:59:09
один момент

Класс bs4

Фаак

Worlak
01.04.2019
12:02:12
на декоде он умирает

Tishka17
01.04.2019
12:02:20
омг

ты как html генерируешь?

Worlak
01.04.2019
12:02:37
поэтому такой костыль со стэковерфлоу

Tishka17
01.04.2019
12:02:54
потому что ты делаешь че попало вместо того чтобы разобраться

Worlak
01.04.2019
12:03:47
задача была мелкая и надеялся обычной вставкой в нужном месте решить проблему. С джсоном подобное решалось одной строчкой без энкодов

html получается из bf4

после вставки в тело необходимого куска

Tishka17
01.04.2019
12:04:36
что за файл 1.1_step?

а, это принт

ну html в начале вененше нормальный

сервер какой?

Worlak
01.04.2019
12:06:21
да, после попадения в словарь он показывает уже преобразованную в нужную

Tishka17
01.04.2019
12:06:35
я. нихрена не понял

Worlak
01.04.2019
12:07:18
секунду

Google
Tishka17
01.04.2019
12:07:18
это вообще что, веб приложение у тебя?

Worlak
01.04.2019
12:07:21
бред написал

это вообще что, веб приложение у тебя?
это хренов парсер, написанный неизвестно кем, который добавляет кусок в страницу для рекламы

Tishka17
01.04.2019
12:08:02
судя по этому скрину у тебя либо мета кривая, либо в хэдерах сервреа лажа

давай-ка дамп хэдеров

Worlak
01.04.2019
12:08:19
оригинал без загрузки херни выглядит так

Tishka17
01.04.2019
12:10:06
так

а что за сервер отдает страницу и ты как там вклиниваешься?

выглядит как будуто ты хэдер подменил

Worlak
01.04.2019
12:11:15
как работает в целом. Есть точка через которую идут все коннекты, а она сует рекламу в хттп странички

Tishka17
01.04.2019
12:11:49
хэдеры не подменяет?

Worlak
01.04.2019
12:11:57
не должна сейчас гляну

Не меняет

но в заголовке страниц utf-8, насильно конечно поменял для тестов на необходимое, но он бьется при возвращении

windows-1251

пофиксил

Проблема была в том, что насильно bf4 по дефолту перебивал в utf-8 и помогло банальное возвращение типа при ретурне

Тишка был близок, арагаер правильно толкнул в сторону типа, алекс по делу, но почти все мимо. Ещё раз спасибо всем.

Tigran
01.04.2019
12:37:44
фига разбор полётов

Andrew
01.04.2019
12:37:58
я сам офигел. Стикер с фейспалмом не нашёл

Google
Tishka17
01.04.2019
12:38:28
тишка все еще считает, что если бы ты сделал как Алекс говорит, этой проблемы не было бы

Worlak
01.04.2019
12:39:33
Использование не на моих страницах utf 8 не решило бы проблему

Andrew
01.04.2019
12:40:06
Использование не на моих страницах utf 8 не решило бы проблему
чтение исходных данных в верной кодировке её бы и не создало

Worlak
01.04.2019
12:41:02
чтение исходных данных в верной кодировке её бы и не создало
Верно, но кто знал что исходную кодировку bs4 заменяет на дефолтную utf-8.

Да и то что, сначала принт выводил в нормальном виде, а потом при использовании словаря изменял смутило

Tishka17
01.04.2019
12:43:05
Использование не на моих страницах utf 8 не решило бы проблему
ещё раз: когда читаешь - все преобразовываешь в unicode, а потом при выводе преобразовываешь уже в ту, которая нужна

правда да, тебе надо ещё запоминать какая нужна

Alex
01.04.2019
13:02:21
Использование не на моих страницах utf 8 не решило бы проблему
нет, ты всего лишь должен работать внутри программы только с юникодом (не UTF-8), на входе преобразовывать данные из исходной кодировки в юникод, на выходе - из юникода в нужную кодировку (желательно UTF-8).

Worlak
01.04.2019
13:18:12
нет, ты всего лишь должен работать внутри программы только с юникодом (не UTF-8), на входе преобразовывать данные из исходной кодировки в юникод, на выходе - из юникода в нужную кодировку (желательно UTF-8).
Желательно не применимо. Нужная кодировка поступает изначально от страницы. Благо работать с данными не пришлось и производилась только вставка. Спасибо что пытался помочь. Твой совет в будущем если будет подобная ситуация использую

Tishka17
01.04.2019
13:35:32
народ, кто aerospike юзал?

чет у меня нифига range фильтр не работает

Владимир
01.04.2019
13:38:47
народ, кто aerospike юзал?
омг, новый тренд переезжать на аэроспайк? Чем он хорош?

Владимир
01.04.2019
13:39:31
да
Чем мотивируют, чем хорош?

Tishka17
01.04.2019
13:39:43
говорят сам умеет шардиться

Страница 8587 из 9768