
leon4uk
11.01.2017
09:54:15
только у меня там все в БД сливается

я люблю грин дей
11.01.2017
09:54:35

leon4uk
11.01.2017
09:55:29

я люблю грин дей
11.01.2017
09:58:50

Google

ॐ
11.01.2017
10:12:24
лол, лента ру сообщает что фисиби взломали телеграмчик

leon4uk
11.01.2017
10:13:45
что так?
поиграл в героев и хватило перед сном)

Иисус
11.01.2017
10:14:20

ॐ
11.01.2017
10:14:22

leon4uk
11.01.2017
10:14:36

Иисус
11.01.2017
10:14:52
типа вот я создал бота, в куда мне теперь код писать?)

ॐ
11.01.2017
10:14:55

leon4uk
11.01.2017
10:14:57
у них есть квантовый компьютер) я уверен
получается что используем только pgp с 4 кб ключом
лапти, скинь ссыль

Славик
11.01.2017
10:16:58
сначала выбираешь технологию/язык программирования
потом пишешь парсер

Google

Славик
11.01.2017
10:17:20
либо получаешь rss-ленту хабра
что удобнее

ॐ
11.01.2017
10:17:59
лапти, скинь ссыль
lenta.ru/news/2017/01/11/telegramvzlom/?utm_source=lentavk&utm_medium=social&utm_campaign=fsb-ochen-interesovalas-telegram-iz-za

Славик
11.01.2017
10:18:25
а чтобы отослать в чат, достаточно выполнить http-запрос, например, в пхп для этого есть функция быдлофункция file_get_contents($url);
https://api.telegram.org/bot123456:ABC-DEF1234ghIkl-zyx57W2v1u123ew11/sendMessage?chat_id=CHAT_ID&text=TEXT
только вместо 123456:ABC-DEF1234ghIkl-zyx57W2v1u123ew11 подставляешь свой api-key

leon4uk
11.01.2017
10:19:49

ॐ
11.01.2017
10:21:52


leon4uk
11.01.2017
10:22:06
URL url = new URL(this.url);
HttpURLConnection conn = (HttpURLConnection)url.openConnection();
conn.setRequestMethod("POST");
conn.setConnectTimeout(10000);
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.8.1</version>
</dependency>
библиотеку эту использовал для парсинга
я выводил интерфейс в html и оттуда выбираешь что нужно парсить. Классно получилось. Только не монетизируется это нифига
Document doc2 = Jsoup.connect(url + x).get();
Elements id = doc2.select("div[class = item-sku]>span[id=item_id]");
Elements category = doc2.select("select[id=category]>option[selected]");
Elements titles = doc2.select("h1[class=h1]");
Elements description = doc2.select("div[id=desc_text]");
Elements prices = doc2.select("span[class=p_i_price]>span[itemprop=price");
Elements sellerName = doc2.select("div[id=seller]>strong[itemprop=name]");
Elements date = doc2.select("div[class=item-subtitle]");
так вот html распарсивается


Kosta
11.01.2017
10:26:37

leon4uk
11.01.2017
10:26:47

Славик
11.01.2017
10:26:53
но конкретно эту задачу между сделать средствами линукс
через wget получать html, парсить через какой grep и через curl отправлять

leon4uk
11.01.2017
10:27:16
curl ом?

Google

leon4uk
11.01.2017
10:27:21
и wget

Славик
11.01.2017
10:27:33
но у хабра есть rss
можно не делать велосипед, а просто подписаться и перенаправлять

leon4uk
11.01.2017
10:27:49

Славик
11.01.2017
10:27:59
нужны только заголовки, все остальное будет засорять чат
короче, это реально простая задача

leon4uk
11.01.2017
10:28:46

Славик
11.01.2017
10:29:10
ты там деньги рассылаешь

leon4uk
11.01.2017
10:29:12
или тендер

Славик
11.01.2017
10:29:15
лучше объяви конкурс
кто сделает бота, получит денежный приз

leon4uk
11.01.2017
10:29:55
а машинку предоставят, где будет сдеплоин бот?)

Славик
11.01.2017
10:30:14
если код меня устроит, я повешаю его себе
но доступа к виртуалке не дам
сам задеплою
у меня ubuntu server 16 вроде, если что
там санни тусуется

leon4uk
11.01.2017
10:36:50
ну посмотрим как люди справятся со стандарными утилитками линукса
а то у меня велосипед жирный как ты говоришь

Славик
11.01.2017
10:38:34
думаю, даже если им косарь за этот мелкий скрипт предложить, все равно всем будет лень

Google

leon4uk
11.01.2017
10:40:50
ну не знаю. тысяча для кого то богатство
cron ом делать curl полученного распарсенного контента с хабра не так тяжело думаю. Только я не очень умею пользоваться wget .
http://stackoverflow.com/questions/31503408/wget-to-parse-a-webpage-in-shell
тут есть описание что да как. Мне быстрее на java будет все это написать
Славик, объяви конкурс!
я постараюсь в свободное время сделать свою реализацию. Потом выберешь лучший вариант и все

Славик
11.01.2017
10:45:56
так а кто спонсор?

Admin
ERROR: S client not available

leon4uk
11.01.2017
10:46:03
Илья

Славик
11.01.2017
10:46:09
Илья, давай деньги
https://habrahabr.ru/rss/hubs/all/
https://geektimes.ru/rss/hubs/all/
остается только брать отсюда новые и пересылать

leon4uk
11.01.2017
10:52:08
Можно заюзать тут stax библиотеку
Я думал прям с самого сайта нужно брать заголовки

Славик
11.01.2017
10:52:53
http://stackoverflow.com/questions/443991/how-to-parse-rss-feeds-xml-in-a-shell-script
как бы только дату проверить

leon4uk
11.01.2017
10:54:24
Какую дату?

Славик
11.01.2017
10:54:30
поста

leon4uk
11.01.2017
10:54:53
Аа. Не легче брать сам html с сайта?

Google

Славик
11.01.2017
10:55:03
сохранять дату последнего отправленного поста при запуске и при каждом следующем запуске пересылать только новые
так тут уже всё готово

leon4uk
11.01.2017
10:57:02
сам идею и реализовал)
тихо закрыл IDEA'ю...

Славик
11.01.2017
11:02:06
стой, не
если ты напишешь бота, то давай
я сам это доводить до рабочего состояния не буду

Deva
11.01.2017
11:33:19
Воть такой большой телик в политехе стоит
(Музее) на ВДНХ
Панасоник

ॐ
11.01.2017
11:34:56
youtu.be/818ExwMx0yE

Kosta
11.01.2017
11:36:07
Пойду пофапаю на отражение.

Deva
11.01.2017
11:36:36
?

Kosta
11.01.2017
11:37:52
?
Ну а что на работе еще делать то?

Deva
11.01.2017
11:40:46
Интересный вопрос ?

Il'ya
11.01.2017
12:13:14
https://habrastorage.org/files/4c0/6f6/092/4c06f6092dd74babb6ed589aa7505f4a.png

leon4uk
11.01.2017
12:41:17
биткоин заболел :(