
Nikita
03.01.2018
16:47:41
Т.е. есть фотография чека, надо выдрать данные с негл
куды копать?

Shmaltorhbooks
03.01.2018
16:49:01

Maksim
03.01.2018
16:49:23
довольно просто на самом деле. даже знаю проект в спб, который успешно этим занимается)

Google

Shmaltorhbooks
03.01.2018
16:49:27
может есть какой-то софт или апишечка для распознавания, но форматов чеков - тысячи. и научить её всем - вряд ли возможно
https://habrahabr.ru/post/319042/
вот тут пишут, что у ABBYY есть какое-то апи для этого

Maksim
03.01.2018
16:55:13
там разные варианты чеков с разными нюансами) это ты верно подметил. 1 общую вундервафлю сделать не выйдет.
в целом, реально если захотеть. Но как я уже рассказать не могу.... нда, все дела.

Shmaltorhbooks
03.01.2018
16:56:02
погуглил мельком - все приложения, которые заявляют что могут сканировать чеки на google play имеют оценку приблизительно 3,5
и в каментах куча жалоб, что нифига не распознаёт
включая платные
в общем и целом - никак. но под шаблоны конкретной торговой сети, наверное, можно что-то научить)

Maksim
03.01.2018
16:57:06
так это и работает. Конкретный мерчант - свой темплейт.
при чём есть так же ручная модерация, которая отлавливает новые сети и впихивает их в ректальное отверстие разработчиков
тот проект, что я скинул тебе, когда учавствовал в нём за предоставленные чеки наоборот пару копеек накидывал)

Shmaltorhbooks
03.01.2018
17:01:13
Им нужны были шаблоны?

Google

Maksim
03.01.2018
17:01:27
скорее данные. а шаблоны были следствием

Shmaltorhbooks
03.01.2018
17:02:27
Ну понятно) все упоролись по бигдате, а забыли, что она стоит на данных, а данные стоят дорого)))
Много данных - очень дорого))

Konstantin
04.01.2018
10:40:36

M
04.01.2018
11:31:51

Shmaltorhbooks
04.01.2018
11:33:55
Чек - это же не просто набор цифр. Это набор неких данных со своей структурой. А просто ocr выдаст дикую мешанину букв и цифр
Не думаю, что это является конечной целью распознавания

Sergey
04.01.2018
11:36:47
по сути ты предлагаешь нейронку только для OCR (что делать самому глупо) ну и тут если делать в два подхода ошибки будут накапливаться
потому тебе придется выдумывать свой вариант который будет не просто OCR делать а еще и прикидывать что там может быть (что сильно должно сказаться на точности в лучшую сторону)
но в любом случае самый гемор будет набрать достаточную выборку данных для тестирования/обучения

Shmaltorhbooks
04.01.2018
11:38:32
Плюс в чеке, по идее, много подсказок

Sergey
04.01.2018
11:38:38
именно
может попрактиковаться в deep learning...

Shmaltorhbooks
04.01.2018
11:39:25
В некоторых местах только цифры могут быть, количество комбинаций букв в названиях - конечная и часто повторяется, есть контрольная сумма для цифр)

Sergey
04.01.2018
11:39:55
но вообще...

Shmaltorhbooks
04.01.2018
11:40:47
Но вообще - нельзя просто взять и распознать первый попавшийся чек
В буквы - можно

Andru
04.01.2018
11:41:10
Дороу ребятки. Может кто-то знает как в шторме из php файла слелать стандарт кодстайла. А то лид говорит что такое есть, а я найти не могу хоть убейсь

Google

Shmaltorhbooks
04.01.2018
11:41:14
В структуру - не
Xml писать надо, если мне не изменяет память

Дмитрий
04.01.2018
11:42:08

Saško
04.01.2018
11:42:10
тут ещё вопрос как именно надо чек распознать
если только Тотал — эт одно и вполне посильно
если же список товаров/услуг это уже весьма сложно, т.к. текста дохера, он сокращенный и часто бывает мятый/искаженный

Sergey
04.01.2018
11:42:23

Saško
04.01.2018
11:43:48

Shmaltorhbooks
04.01.2018
11:43:55
Может не быть
Мне банк тотал шлёт в вайбер

Saško
04.01.2018
11:44:44
ну плюс не всегда платишь картой

Shmaltorhbooks
04.01.2018
11:44:50
Плюс надо привязать конаретнвй чек к одной из тысяч смс

Shmaltorhbooks
04.01.2018
11:44:59
Конкретный *

Sergey
04.01.2018
11:46:21
вопрос то в детализации расходов как мне кажется

Shmaltorhbooks
04.01.2018
11:46:57
И что?
Из того же магазина может быть тыща смсок
Ну, или не магазина, а банка или сети, не суть

Konstantin
04.01.2018
11:47:44

Google

Saško
04.01.2018
11:48:31

Andru
04.01.2018
11:48:41

Konstantin
04.01.2018
11:49:11
Кароче это очень сложно. Такое дорого и долго делать

Sergey
04.01.2018
11:49:41
ну и опять же тебе для каждого этапа может понадобиться своя какая-то система препроцессинга которая будет компенсировать ошибки

Andru
04.01.2018
11:50:25
Code -> Reformat Code ?
Не то, это каждое праило нужно искать, править, и проверять. А так ты в одной пыхном файле все высавил все по феншую, и валидатор не ругается, а потом просто скормил этот файл идеешке, и она подстроилась

Admin
ERROR: S client not available

Sergey
04.01.2018
11:50:27
короч, все это не так просто и требует огромных усилий и эксперементов. А еще - я бы начал с того что бы погуглил ресерчи готовые
https://confluence.jetbrains.com/display/PhpStorm/PHP+Code+Sniffer+in+PhpStorm
ты ж не уточнял что у тебя оно уже есть

Andru
04.01.2018
11:51:24

Sergey
04.01.2018
11:51:44

Chupa
04.01.2018
11:56:01
В РФ чеки в налоговую почти сразу должны отсылаться, должен быть способ туда вклиниться, вот в других странах сложнее с этим
Даже в столовых, где все в тетрадке писали поставили мини кассы

Sergey
04.01.2018
11:59:41
https://dzone.com/articles/using-ocr-for-receipt-recognition
статей подобных много, есть публикации
с этого надо начинать если захочешь упороться

Rishat
04.01.2018
12:11:43
Привет всем, вообщем на vagrant (Homestead имею), решил поставить xdebug и никак не могу поставить, пишу 1) vagrant ssh 2) далее php -i > file.txt и аутпут весь в https://xdebug.org/wizard.php , далее делаю все что там просят. И в итоге phpstorm не видит его и говорит что он не стоит, куда копать?( целый день уже тыкаю((
Сам проект крутится на php5.6, сначала хотел xDebug тоже на 5.6 поставить, ноо что-то на сайте говорят пшел вон, версия нужна пыхи больше 7.. Ну решил для теста на 7.1 все провернуть (

Google

Sergey
04.01.2018
12:15:56

Rishat
04.01.2018
12:22:08
2) Мне кажется расположение другое у меня, или норм?
cd /etc/php/php[version]/fpm/conf.d
—- в мануале, у меня нету такого(

Sergey
04.01.2018
12:22:34
хватит спамить картинками
гугли, тема настолько распространенная что ну не знаю

Alexander
04.01.2018
12:23:16

Samat
04.01.2018
12:41:57
ребят, подскажите, что возвращает array_filter, если ни одно значение не подходит по callback-функции?

Shmaltorhbooks
04.01.2018
12:42:54
пустой массив

Samat
04.01.2018
12:47:38

Sergey
04.01.2018
13:48:13

Big_Shark
04.01.2018
13:51:11
@fes0r ну как там твоя либ

Sergey
04.01.2018
13:52:08
@fes0r ну как там твоя либ
1. я принял твою позицию и понял что трансформеры и ресолверы стоит разделять
2. я отказался от трансформеров (возможно временно)
3. на выходных залью - вчера только закончил ресолверы мутить собирать. Пока все очень примитивно.
p.s. в целом мне пока удобно - сегодня хотел на пет проекте потестить

Big_Shark
04.01.2018
13:55:05

Rishat
04.01.2018
15:45:51
гугли, тема настолько распространенная что ну не знаю
The Zend Engine API version 320160303 which is installed, is outdated.
гуглил, по новой пытался все поставить, не могу разрезолвить эту проблему и все :( На stackе находил парней, которым не ответили по этому поводу

Dmitriy
04.01.2018
16:21:04
там еще можно сошку скомпилить если нужна производительность

Max
04.01.2018
19:13:03