
Aragaer
07.12.2018
11:00:58
все равно же перебор

Маришка
07.12.2018
11:01:20

Aragaer
07.12.2018
11:01:24
берешь список, идешь по нему листкомпом, генеришь новый, записываешь на место старого
хотя

Google

Aragaer
07.12.2018
11:01:51
покажи конкретную задачу, чо уж там

Alex
07.12.2018
11:01:55

Tishka17
07.12.2018
11:02:19

Nikolay
07.12.2018
11:02:52
Это чат для профессионалов

Мой любимый
07.12.2018
11:03:12
С дома залью

Maxim robox
07.12.2018
11:03:14
Функциональщины ему подкиньте!

Aragaer
07.12.2018
11:03:18
я так понял - идем по списку. Возможно из первых элементов этого списка нам надо делать правки в большом количестве последующих (однократно, а потом их отдавать)

Nikolay
07.12.2018
11:03:20
Целыми днями обсуждение как обходить списки

Tishka17
07.12.2018
11:03:23
пф

Aragaer
07.12.2018
11:03:48
тогда б я б сделал генератор, куда скармливаешь исходный, а оттуда вываливается результат

Maxim robox
07.12.2018
11:04:50
Кто-нибудь сегодня елку решил как-нибудь изощренно? Мультитредингом там или асинками. Покажите.

Aragaer
07.12.2018
11:05:08
лисп считается за изощренное 8)

Google

Маришка
07.12.2018
11:05:11

Maxim robox
07.12.2018
11:05:20

Маришка
07.12.2018
11:05:50
Ней, я нетворкх просто взяла и веса проставила ребрам

Tigran
07.12.2018
11:06:25
ах ты

Маришка
07.12.2018
11:06:31
Ах ты

Alex
07.12.2018
11:11:33

Maxim robox
07.12.2018
11:11:52

some_random_anonymous
07.12.2018
11:16:24
Я лично перехожу на вечеренее решение ёлки.
Подкинули на работе серьезных тасков и задачи стали чуть посложнее.

Tishka17
07.12.2018
11:19:28
я перед началом работы

*************
07.12.2018
11:25:14
Товарищи, в первые вижу эту ошибку по гуглил и вроде Я всё правильно делаю -
import requests
from requests.auth import HTTPBasicAuth
import json
user = 'user'
passwd = 'pass$'
url = 'url'
# Make your request
response = requests.get(url, auth=HTTPBasicAuth(user, passwd))
# Convert JSON to dict
r = response.json()
print(r)
ОШИБКА
json.decoder.JSONDecodeError: Expecting value: line 2 column 1 (char 1)

Denis
07.12.2018
11:26:43

*************
07.12.2018
11:27:06

Denis
07.12.2018
11:27:20

*************
07.12.2018
11:28:27

Dmitri
07.12.2018
11:28:48

nnm
07.12.2018
11:29:26
7
С пределах прямоугольника 80х25 символов

Maxim robox
07.12.2018
11:29:28

Dmitri
07.12.2018
11:29:48

*************
07.12.2018
11:30:07

Google

*************
07.12.2018
11:30:28
Ошибка такая
json.decoder.JSONDecodeError: Expecting value: line 2 column 1 (char 1)

Tishka17
07.12.2018
11:30:46
а что, текст залогировать не?

Dmitri
07.12.2018
11:30:48

Ser
07.12.2018
11:44:24

Yegor
07.12.2018
11:50:37
Товарищи, сколько денег просить за парсер сайта?
Или может расскажете какое-то ценообразование?

Ilia
07.12.2018
11:50:53

Yegor
07.12.2018
11:51:28
Ну я с сайта выдергиваю около 26к нужных единиц чего-то

Ilia
07.12.2018
11:51:52

Yegor
07.12.2018
11:52:36
ну если совсем конкретно то номер телефона

Ilia
07.12.2018
11:53:28
Ну это строчка, как бы, неких данных. Ко-во строк не должно влиять на стоимость вообще.
Входит в базовую.

Viktor
07.12.2018
11:54:21

Ilia
07.12.2018
11:54:26

Yegor
07.12.2018
11:55:07
вобщем все плохо)))

Ilia
07.12.2018
11:55:15

Viktor
07.12.2018
11:57:04
ну он же не первый раз программирует и примерно знает сколько примерно времени на это потратит, а с заказчиком договаривать о цене часа и говорить сколько по максимуму может занять времени задача.

Ilia
07.12.2018
11:57:39
вобщем все плохо)))
Я полагаю, надо выделить сколько страниц информации надо обработать, и сколько единиц информации (полей) вычленить.
Далее -- базовая цена,
+ на каждую страницу -- базовая цена страницы
+ на каждое доп. поле -- базовая цена доп. поля.
+ поля и страницы надо ранжировать по сложности, простые, средние, сложные
Разные цены будут.

Google

Yegor
07.12.2018
11:58:34
В том то и дело что первый раз

Ilia
07.12.2018
11:59:12
вобщем все плохо)))
Кстати, а как ты JS на странице обрабатываешь?
Если они там не дурни, они же будут через JS данные высылать, а не на чистом HTML...

Ognev
07.12.2018
12:00:00

Nybkox
07.12.2018
12:00:06
Гайз, кто-то делал тг ботов с панелью управления? Есть ли смысл от джанги или фласка хватит?

Yegor
07.12.2018
12:00:09
там все в хтмл
я уже почти все сделал

Admin
ERROR: S client not available

nnm
07.12.2018
12:00:53

Yegor
07.12.2018
12:01:04
Но смысл?

Nybkox
07.12.2018
12:01:33
Вот и я его ищу.

Ilia
07.12.2018
12:01:53
там все в хтмл
ВОт если HTML, может быть 3 разновидности:
Парсится regex
парсится только XML-парсером,
Парсится только HTML-парсером.
Первая очень простая, две остальные -- сильно сложнее.
А, кажется уже сам нашёл

nnm
07.12.2018
12:03:20

Ilia
07.12.2018
12:04:15

Тимур
07.12.2018
12:04:32
Или может расскажете какое-то ценообразование?
Человека\часов универсальная мера. Например стоишь ты 15 долларов в час или 50 долларов в час. Оцениваешь время, выставляешь примерную стоимость. Если будут правки, пожелания, или проблемы, которые увеличивают время, увеличивается и стоимость

Ilia
07.12.2018
12:05:18

Тимур
07.12.2018
12:05:44
Сложность задания оценить сложно, кто то делает быстрее, кто то дольше. И качество от времени не всегда зависит.

Google

Тимур
07.12.2018
12:07:00
То что ты делаешь впервые оценить сложно, только на ощущениях. То что ты уже делал, ты должен и так знать примерное время. Чел из Яндекса оценивал всю работу по формуле, что то вроде. думает 3 месяца надо * 1.7 = 153 дня + 1 неделя.
1 неделю он всегда добавлял для того, что если проебет все дедлайны, то ему хватит 1 недели, чтобы кое как сделать любой проект на коленке

Ilia
07.12.2018
12:11:23
Ладно, вопрос реально сложный...

Тимур
07.12.2018
12:13:33
Ну, это философия всё.
Пустое.
Я например парсил кинопоиск давно, задача была, со страниц стащить все фильмы, данные актеров, продюссеров вот это все, правильно в базу по табличкам, чтобы бери и пользуйся, а также скачать в папку с путями все трейлеры, если они есть, все обложки. В общем все-все, кроме отзывов. Я скрипт написал за вечер, парсило-качало 2-3 дня. И жесткий диск передал заказчику за 100 баксов.
Хотя в то время баксов 200 было. помню 30 000 тенге было.

Ilia
07.12.2018
12:14:27
Я например парсил кинопоиск давно, задача была, со страниц стащить все фильмы, данные актеров, продюссеров вот это все, правильно в базу по табличкам, чтобы бери и пользуйся, а также скачать в папку с путями все трейлеры, если они есть, все обложки. В общем все-все, кроме отзывов. Я скрипт написал за вечер, парсило-качало 2-3 дня. И жесткий диск передал заказчику за 100 баксов.
Ну, чёт дёшево... Оно и без проксей по идее не должно было работать

Тимур
07.12.2018
12:15:26

Ilia
07.12.2018
12:15:42
Я например парсил кинопоиск давно, задача была, со страниц стащить все фильмы, данные актеров, продюссеров вот это все, правильно в базу по табличкам, чтобы бери и пользуйся, а также скачать в папку с путями все трейлеры, если они есть, все обложки. В общем все-все, кроме отзывов. Я скрипт написал за вечер, парсило-качало 2-3 дня. И жесткий диск передал заказчику за 100 баксов.
Ну и я что-то не верю, там только БД под это ваять надо дня два. И сайт сам изучать по структуре данных минимум дня 2.

Тимур
07.12.2018
12:15:43
Время 2-3 дня, да хоть неделю если твой скрипт работает,

Ilia
07.12.2018
12:17:14

Тимур
07.12.2018
12:17:17

Ilia
07.12.2018
12:17:58
Ну ок, ты видимо гений-хакер...

Тимур
07.12.2018
12:18:11

Ilia
07.12.2018
12:19:26
Ну, ну ты всё равно гонишь, вечер -- это 4 часа, ну, ок, может 8 часов, один рабочий день.
Ну, не утолкать всё в 8 часов это...
Я -то как бы не против, но просто потом получается, что заказчики думают, что такая задача -- это раз плюнуть, и на фрилансах любой сайт парсить заказчики предлагают за 2-5 тысяц рублей.
Ну ладно...

Тимур
07.12.2018
12:21:04
Ну ок, ты видимо гений-хакер...
Не думаю, что это сложно. просмотри страницу. https://www.kinopoisk.ru/film/vlastelin-kolec-dve-kreposti-2002-312/ - там большая часть полей это аттрибут у таблицы Фильм. Обложка тоже может быть аттрибутом на скаченный файл. Таблица Трейлеров, Таблица сотрудников.