Alex
бля... завалил горизонт
Alex
у тебя проблема с кодировками.
Kop
Да ладно кэп
Alex
судя по всему ты отдаешь UTF-8, который отображается как CP-1251
Kop
Да
Alex
или что-то в этом роде. дикт тут не при чем
Kop
Причём
Kop
Все четко
Anonymous
не надо
Alex
https://www.artlebedev.ru/decoder/
Anonymous
кодировки проверяй
Alex
И что мы тут должны увидеть?
Alex
У тебя твой html в какой кодировке?
Alex
А браузер в какой кодировке его отображает?
Co(n)stantine👨‍🔬
windows
Kop
Поступает в windows-1251 и других экзотических
Alex
Укажи правильную кодировку для браузера, в мета тегах или еще где.
Alex
словри в питоне тут никаким хуем
Kop
Я тебе факт показываю. Вот сейчас снова чекну и отправлю нормальные скрины
Alex
Поступает в windows-1251 и других экзотических
ну так декодируй из исходной кодировки при получении в юникод
Tishka17
1. Выкинь cp1251 и поставь везде utf-8 2. Пропиши utf-8 в html
Kolyann
Kop
Тогда сломается ведь, не?
Alex
1. Выкинь cp1251 и поставь везде utf-8 2. Пропиши utf-8 в html
Я так понял он скрапит какое-то говно в cp1251, при этом забивает на исходную кодировку и отдает в utf-8 (хотя на самом деле там cp1251)
Tishka17
Ну фигли, входные данные надо конвертировать
Alex
но при этом у него виноваты дикты.
Tishka17
А декод при скрапинге, не?
Alex
все бьется, потому что ты нихуя не понимаешь как работают кодировки. от слова совсем.
Tishka17
Точнее наверно в requests надо кодировку указать
Alex
requests может о кодировке и не знать.
Kop
все бьется, потому что ты нихуя не понимаешь как работают кодировки. от слова совсем.
Про словари это я сказал на каком моменте бьется, а бьется потому что другая кодировка изначально и в словаре показывает уже преобразованную умник
Kop
Я же факты показывал
Tishka17
У тебя питон2?
Kop
Тоесть тот же принят скажет все норм и покажет в изначальной, но когда ты положишь в словарь и принтанешь будет другое
Tishka17
Ух
Alex
Точнее наверно в requests надо кодировку указать
Кодировка должна указываться либо в Content-Type: ... charset либо в мета теге
Tishka17
Блин
Tishka17
Да
Ты серьезно?
Kop
Ты серьезно?
Меня заставили
Tishka17
Вали оттуда
Kop
Последний проект и я увольняюсь
Kop
Я не выношу это дерьмо
Tishka17
Короче, тебе надо всё преобразовать в юникод строки и везде юзать только из
Anonymous
Последний проект и я увольняюсь
И долго тебя на питоне втором держат?
Tishka17
И при выводе можешь уже энкод обратно
Alex
если кодировка указана в meta, но не в заголовках, requests ну никак ее не определит.
Alex
поэтому либо парсишь контент, либо надеешься на chardet.
Kop
И долго тебя на питоне втором держат?
Почти 8 месяцев, при этом доплачивая, но нет моих сил, сказали и дальше с этим деоьмом жить
Tishka17
Пробну, спасибо
Собственно, что Алик тебе и объясняет
Kop
поэтому либо парсишь контент, либо надеешься на chardet.
В заголовке передаётся и я ее спарсиваю
Alex
ну вот если requests тебе не делает декод автоматом, ты должен сам его сделать.
Tishka17
Ну значит у себя в шаблоне смотри, что ты выдаёшь
Tishka17
И вообще, минимальный код в студию
Alex
и потом на выходе уже encode в нужную кодировку (не исходную, а ту в которой ты результат отдаешь)
Alex
лучше в utf-8
Alex
везде используй UTF-8
Kop
Пару минут, модем подрублю и поскидываю
Andrew
Пора уже глоссарий заебашить с решением типовых вопросов
Kop
вот такой кусок во тчто выводит
Aragaer
а зачем сначала decode, а потом encode сразу?
Kop
а зачем сначала decode, а потом encode сразу?
бьется и ругается что не может
Anonymous
Мне бы ваши проблемы..
Aragaer
а просто сделать decode и на этом успокоиться?
Aragaer
только без str
Aragaer
и вообще, какой тип у html?
Kop
один момент
Kop
Класс bs4
Kop
Фаак
Kop
на декоде он умирает
Tishka17
омг
Tishka17
ты как html генерируешь?
Kop
поэтому такой костыль со стэковерфлоу
Tishka17
потому что ты делаешь че попало вместо того чтобы разобраться
Kop
задача была мелкая и надеялся обычной вставкой в нужном месте решить проблему. С джсоном подобное решалось одной строчкой без энкодов