@ru_python

« Назад

Страница 3077 из 9768

Далее »

Проксимов

02.07.2017
10:27:19

Ему прям сука в ошибке написано что поменять

Igor

02.07.2017
10:27:41

где здесь по делу? человек проблему хочет решить какую-то, а вы линтер ходячий из себя представляете. raw[:75], видите ли, ниче не делает.

Маришка

02.07.2017
10:27:56

где здесь по делу? человек проблему хочет решить какую-то, а вы линтер ходячий из себя представляете. raw[:75], видите ли, ниче не делает.

Ну так хдд

Проксимов

02.07.2017
10:28:24

где здесь по делу? человек проблему хочет решить какую-то, а вы линтер ходячий из себя представляете. raw[:75], видите ли, ниче не делает.

Это не я сказал

Google

Eugene

02.07.2017
10:28:35

type(raw) len(raw) raw[:75] ну это и правда забавно о.о

Проксимов

02.07.2017
10:28:44

где здесь по делу? человек проблему хочет решить какую-то, а вы линтер ходячий из себя представляете. raw[:75], видите ли, ниче не делает.

Бля такие проблемы в бегинерсах

Там учат читать трейсбек

Не здесь

Igor

02.07.2017
10:29:06

ну да, это, конечно, офигенный повод хуесосить человека здесь

Проксимов

02.07.2017
10:29:21

ну да, это, конечно, офигенный повод хуесосить человека здесь

Да

C:\ProgramData\Anaconda3\lib\site-packages\bs4\__init__.py:181: UserWarning: No parser was explicitly specified, so I'm using the best available HTML parser for this system ("lxml"). This usually isn't a problem, but if you run this code on another system, or in a different virtual environment, it may use a different parser and behave differently. The code that caused this warning is on line 231 of the file C:\ProgramData\Anaconda3\lib\site-packages\spyder\utils\ipython\start_kernel.py. To get rid of this warning, change code that looks like this: BeautifulSoup(YOUR_MARKUP}) to this: BeautifulSoup(YOUR_MARKUP, "lxml") markup_type=markup_type))

Вот

Boojum

02.07.2017
10:30:00

type(raw) len(raw) raw[:75] ну это и правда забавно о.о

Вероятно, код написан в Юпитере, и эта строчка призвана выводить raw

?

02.07.2017
10:30:58

Вот

что вот, я и прописывал lxml, но в "" а надо было '

Проксимов

02.07.2017
10:31:22

что вот, я и прописывал lxml, но в "" а надо было '

О_о

Igor

02.07.2017
10:31:36

что вот, я и прописывал lxml, но в "" а надо было '

неправда, в чем-то еще проблема была. видимо, в этом ?, [Jul 2, 2017, 1:20 PM]: raw = BeautifulSoup("html", "lxml").get_text() html надо было без кавычек.

?

02.07.2017
10:31:56

неправда, в чем-то еще проблема была. видимо, в этом ?, [Jul 2, 2017, 1:20 PM]: raw = BeautifulSoup("html", "lxml").get_text() html надо было без кавычек.

и без ковычек ставил

или не ставил. не помню

Google

Проксимов

02.07.2017
10:32:44

что вот, я и прописывал lxml, но в "" а надо было '

В питоне нет разницы между этими кавычками

?

02.07.2017
10:32:49

я вообще по книге читаю, а вы сразу напали

Проксимов

02.07.2017
10:32:58

я вообще по книге читаю, а вы сразу напали

Скрин книги

Интересно что за книга

?

02.07.2017
10:33:25

Работа с HTML Большая часть текста в Интернете находится в формате HTML-документов. Вы можете использовать веб-браузер, чтобы сохранить страницу в виде текста в локальный файл, а затем получить доступ к этому, как описано в разделе о файлах ниже. Тем не менее, если вы собираетесь делать это часто, легче всего поручить Python делать эту работу. Первый шаг такой же, как и раньше, с использованием urlopen. Забавы ради мы выберем историю BBC News под названием Блондинки вымрут через 200 лет, городская легенда выданная BBC за установленный научный факт: >>> url = "http://news.bbc.co.uk/2/hi/health/2284783.stm" >>> html = request.urlopen(url).read().decode('utf8') >>> html[:60] '<!doctype html public "-//W3C//DTD HTML 4.0 Transitional//EN' Вы можете ввести print(html), чтобы увидеть содержимое HTML во всей своей красе, включая метатеги, карту изображений, JavaScript, формы и таблицы. Чтобы получить текст из HTML мы будем использовать библиотеку Python под названием BeautifulSoup доступную для скачивания с сайта http://www.crummy.com/software/BeautifulSoup/: >>> from bs4 import BeautifulSoup >>> raw = BeautifulSoup(html).get_text() >>> tokens = word_tokenize(raw) >>> tokens ['BBC', 'NEWS', '|', 'Health', '|', 'Blondes', "'to", 'die', 'out', ...]

Eugene

02.07.2017
10:34:30

Норм такой скрин :D

Проксимов

02.07.2017
10:34:42

Работа с HTML Большая часть текста в Интернете находится в формате HTML-документов. Вы можете использовать веб-браузер, чтобы сохранить страницу в виде текста в локальный файл, а затем получить доступ к этому, как описано в разделе о файлах ниже. Тем не менее, если вы собираетесь делать это часто, легче всего поручить Python делать эту работу. Первый шаг такой же, как и раньше, с использованием urlopen. Забавы ради мы выберем историю BBC News под названием Блондинки вымрут через 200 лет, городская легенда выданная BBC за установленный научный факт: >>> url = "http://news.bbc.co.uk/2/hi/health/2284783.stm" >>> html = request.urlopen(url).read().decode('utf8') >>> html[:60] '<!doctype html public "-//W3C//DTD HTML 4.0 Transitional//EN' Вы можете ввести print(html), чтобы увидеть содержимое HTML во всей своей красе, включая метатеги, карту изображений, JavaScript, формы и таблицы. Чтобы получить текст из HTML мы будем использовать библиотеку Python под названием BeautifulSoup доступную для скачивания с сайта http://www.crummy.com/software/BeautifulSoup/: >>> from bs4 import BeautifulSoup >>> raw = BeautifulSoup(html).get_text() >>> tokens = word_tokenize(raw) >>> tokens ['BBC', 'NEWS', '|', 'Health', '|', 'Blondes', "'to", 'die', 'out', ...]

Ну, я думаю, что было рассчитано на то что ты думаешь головой и после ошибки добавишь 4 буквы

Но это не точно

Eugene

02.07.2017
10:34:57

raw = BeautifulSoup(html).get_text() ну вот же без кавычек ._.

Проксимов

02.07.2017
10:35:24

raw = BeautifulSoup(html, "lxml").get_text()

Всё

Маришка

02.07.2017
10:35:48

Код из интерпретатора скопировал в прогу

Топ

?

02.07.2017
10:36:14

Ну, я думаю, что было рассчитано на то что ты думаешь головой и после ошибки добавишь 4 буквы

я добавил но не убрал кавычки

Код из интерпретатора скопировал в прогу

ты наверное из тех которым кроме как знанием языка больше нечем удивить. вот и сидишь плюешься

спасибо Игорю. остальным быть добрее желаю

возможно вернусь еще с вопросом

Boojum

02.07.2017
10:38:08

спасибо Игорю. остальным быть добрее желаю

Почему ты не хочешь писать в Beginners

Маришка

02.07.2017
10:38:12

Ну уж извините, но bs4 не трогала и хз буду ли хд

?

02.07.2017
10:38:24

я уже как-то писал . меня затроллили

Google

Евгений

02.07.2017
10:38:29

Работа с HTML Большая часть текста в Интернете находится в формате HTML-документов. Вы можете использовать веб-браузер, чтобы сохранить страницу в виде текста в локальный файл, а затем получить доступ к этому, как описано в разделе о файлах ниже. Тем не менее, если вы собираетесь делать это часто, легче всего поручить Python делать эту работу. Первый шаг такой же, как и раньше, с использованием urlopen. Забавы ради мы выберем историю BBC News под названием Блондинки вымрут через 200 лет, городская легенда выданная BBC за установленный научный факт: >>> url = "http://news.bbc.co.uk/2/hi/health/2284783.stm" >>> html = request.urlopen(url).read().decode('utf8') >>> html[:60] '<!doctype html public "-//W3C//DTD HTML 4.0 Transitional//EN' Вы можете ввести print(html), чтобы увидеть содержимое HTML во всей своей красе, включая метатеги, карту изображений, JavaScript, формы и таблицы. Чтобы получить текст из HTML мы будем использовать библиотеку Python под названием BeautifulSoup доступную для скачивания с сайта http://www.crummy.com/software/BeautifulSoup/: >>> from bs4 import BeautifulSoup >>> raw = BeautifulSoup(html).get_text() >>> tokens = word_tokenize(raw) >>> tokens ['BBC', 'NEWS', '|', 'Health', '|', 'Blondes', "'to", 'die', 'out', ...]

блджад. Что за простыни? нахер такое в чат кидать?

Igor

02.07.2017
10:38:36

Почему ты не хочешь писать в Beginners

я угадаю, потому что в бегиннерсах сидят те же прокси и маришка и они там тоже будут его троллить

я уже как-то писал . меня затроллили

а, ну вот, что и требовалось доакзать %)

Маришка

02.07.2017
10:39:39

а, ну вот, что и требовалось доакзать %)

Ну тащемта в бегинерсы последнее время я особо не писала, так что затролили его скорей всего проксим а зарт просто нахер послал

Игорь, ну ты понимаешь

парни вопрос, есть текстовый файл, как с ним работать в питоне на nltk

f = open('file.txt", "r")

это что

with open("file.txt") as f: content = f.read() Также можно читать построчно если файл большой.

with обязательно?

Нет, но без него нужно явно закрывать файл.

как быть с len текста

Маришка

02.07.2017
10:44:11

len("file.txt")?

len(f.read())

len(f.read()) Traceback (most recent call last): File "<ipython-input-36-8afbe392ea3d>", line 1, in <module> len(f.read()) ValueError: I/O operation on closed file.

TypeError: object of type 'builtin_function_or_method' has no len()

я нашел решение

with open("file.txt", "r") as file: content = file.read() print(content)

вот правильно

потом прописываю лен

Google

Маришка

02.07.2017
10:44:11

и все считает

ща попробую

считает

может все дело в filе вместо f

> Все дело в file вместо f > Вместо "" нужно было '

?

02.07.2017
10:45:14

> Все дело в file вместо f > Вместо "" нужно было '

и?

Eugene

02.07.2017
10:45:41

*стикер с Маришкой про теорию*

Admin

ERROR: S client not available

Проксимов

02.07.2017
10:46:33

спасибо Игорю. остальным быть добрее желаю

Самое интересно, что Игорь получил профит

Igor

02.07.2017
10:47:04

ололо, какой?

Проксимов

02.07.2017
10:47:08

Это демпинг какой то

ололо, какой?

Ещё один новичок послал лучи добра тебе в карму

Ну тащемта в бегинерсы последнее время я особо не писала, так что затролили его скорей всего проксим а зарт просто нахер послал

Я его не троллил, вы чего

Сказал ему что надо сделать и где

Это сейчас называется троллингом?

Boojum

02.07.2017
10:49:48

Я не понял, кто-то недоволен, что в beginners люди задают нубские вопросы?

Проксимов

02.07.2017
10:50:17

Я не понял, кто-то недоволен, что в beginners люди задают нубские вопросы?

Этот не бегинерсы если ты не заметил

Igor

02.07.2017
10:50:42

Это сейчас называется троллингом?

ну хорошо, не троллишь, а язвишь. даже сейчас, при общении с Boojum

Проксимов

02.07.2017
10:50:54

ну хорошо, не троллишь, а язвишь. даже сейчас, при общении с Boojum

Остаточек)

Ну ну ё маё ты то меня должен понять

Google

?

02.07.2017
10:51:14

Я не понял, кто-то недоволен, что в beginners люди задают нубские вопросы?

да. потому я здесь

здесь хотя бы ответят

Boojum

02.07.2017
10:51:39

Этот не бегинерсы если ты не заметил

Пересланы сообщения из бегиннерс, нет?

?

02.07.2017
10:51:45

вчера спрашивал

Маришка

02.07.2017
10:51:46

Ну я лишь приебалась к парочке вещей которые не относились к вопросу и в принципе была откритикована опущена и послана нахуй тем кто не умеет читать трейсбек

Все в норме

Igor

02.07.2017
10:52:09

Ну ну ё маё ты то меня должен понять

я тебя не понимаю вместо того, чтобы создать дружелюбную обстановку в бегиннерсах, чела затралеле, а при попытке задать бегиннерские вопросы в основной чат затралеле еще больше

Проксимов

02.07.2017
10:52:40

я тебя не понимаю вместо того, чтобы создать дружелюбную обстановку в бегиннерсах, чела затралеле, а при попытке задать бегиннерские вопросы в основной чат затралеле еще больше

Я его там не тралил хз вообще чё там было

dmks