@DC7499

Страница 377 из 1477
NotABug
23.11.2016
21:17:42
Спасибо, сейчас буду читать про OpenCV
сравнивать попиксельно по ргб массиву если цвета не меняются у одинаковых букв

ну собственно да, opencv короче

0wl
23.11.2016
21:18:01
Цвета мб и не проблема, если бинаризацию сделать

Хотя тут может потерятся важная инфа для классификации букв

Google
NotABug
23.11.2016
21:18:20
0wl
23.11.2016
21:19:29
Короче да, попиксельное сравнение для такой маленькой выборки это прямо мастхев будет. Тем более разовая задача как я понимаю.

Так бы можно было заморочится, обучить классификатор и дальше решать такие штуки ванкликом )

NotABug
23.11.2016
21:20:02
плюс тут еще можно на равные сегменты бить (4х4 квадрат), что вообще найс

сильно облегчит дело

0wl
23.11.2016
21:20:36
Угу. Прямо халява =)

NotABug
23.11.2016
21:20:46
:)

Vitaly
23.11.2016
21:23:02
плюс тут еще можно на равные сегменты бить (4х4 квадрат), что вообще найс
тут проблема в том что буквы расположены близко к друг другу. И если, напримвер букву "А" (пикселизированную) легко определить отдельно. Но, если будет "АБ" это уже будет другой паттерн.

вроде понятно объяснил

NotABug
23.11.2016
21:23:27
да

0wl
23.11.2016
21:24:07
Хм, вечер перестает быть томным в таком случае =)))

Aleks
23.11.2016
21:24:32
может я слишком простой, но если шрифты известны и размеры, то можно собрать все варианты букв и слогов и тем же фотошопом обработать

Utah
23.11.2016
21:24:37
Вечир в хату ребят

Google
Vladusha
23.11.2016
21:25:01
Ну он так и делает же

Aleks
23.11.2016
21:25:03
ну а дальше opencv для поиска совпадений

0wl
23.11.2016
21:25:07
Вообще я бы тебе посоветовал составить алфавит и прогнать свой текст через него. В результате получишь какие-то буквы + плейсхолдеры

Это уже читаемо

Если недостаточно, то уже делай распознавание других паттернов.

NotABug
23.11.2016
21:26:28
так, а изначально задача научиться распознавать ушакаленный Pixelate'ом текст?

0wl
23.11.2016
21:26:32
Кстати Aleks дело предлагает, но это чуть сложнее моего варианта. По времени. Но точность конечно выше

Vitaly
23.11.2016
21:26:45
может я слишком простой, но если шрифты известны и размеры, то можно собрать все варианты букв и слогов и тем же фотошопом обработать
очень большое количество вариантов: аа, аб, ав ... Быстрее думаю, будет мне прочесть книгу по машинному обучения, просмотреть несколько часов лекций, изучить питон и написать программу, чем руками всё это ковырять.

Ладно, я ушел про OpenCV читать

0wl
23.11.2016
21:28:36
мне кажется слишком жирно мешать туда машинное обучение
его туда не подмешаешь, у него выборка маленькая слишком.

Aleks
23.11.2016
21:29:53
я, к сожалению, так и не дошел до opencv, но я думаю, что самый простой вариант - это просто брут на совпадение с паттерном, опять же с известными шрифтами и размерами.

Vitaly
23.11.2016
21:33:33
его туда не подмешаешь, у него выборка маленькая слишком.
учитывая что я знаю шрифт, размер и как производилась пикселизация, я могу так же зашакалить войну и мир. И скормить компьютеру изучать.

0wl
23.11.2016
21:34:10
А откуда у тебя уверенность, что ты получишь тот же результат?

Хотя если ты все исходное знаешь... В этом случае я вообще не вижу проблем чтобы тупо нагенерить букв и сочетаний и натравить на это OpenCV

Это будет проще всего.

E.
23.11.2016
21:36:26
за время дискуссии можно было уже 150 ручками разобрать символов)

Google
0wl
23.11.2016
21:36:48
@call_the_police да ну. Скукота)

E.
23.11.2016
21:37:28
самый простой варик при текущих переменных) но брут по паттерну - я бы так делал

Aleks
23.11.2016
21:37:29
на вход надо добавлять что-то похожее на искомый текст, но точно не войну и мир, то сеть будет искать Толстова в твоём тексте, а не то что ты хочешь.

да и вообще все схватились в последнее время за нейросети и пытаются пропихнуть куда можно и не нельзя)

0wl
23.11.2016
21:38:48
Там ему тут не нужна нейросеть в общем-то

Если загоняться на ML, то хватит обычного классификатора.

Чтобы буковки разобрать и сочетания

И чтобы не генерить руками можно скормить Войну и мир для обучения.

Dolt
23.11.2016
21:43:08
винда 10 шифрует хард?

∀RTUR
23.11.2016
21:45:02
да

BitLocker

Dolt
23.11.2016
21:46:57
это по дефолту при установке ?

∀RTUR
23.11.2016
21:53:11
это по дефолту при установке ?
по желанию можно включить

NotABug
23.11.2016
21:53:19
1056 число перестановок

очень даже не много кстати

∀RTUR
23.11.2016
21:54:10
это по дефолту при установке ?
да, это майкрософтовская тулза

NotABug
23.11.2016
21:57:02
1056 число перестановок
но это не учитывая ловеркейс и апперкейс

Google
Dmitriy
24.11.2016
04:45:10
Привет. Такой вопрос - в разделе реестра HKCR\CLSID есть ком-сервера для которых путь в InprocServer32 выглядит как somename.dll. Т.е. он относительный. Если у меня есть возможность заставить приложение загрузить данный ком-объект, смогу ли я замутить что-то типо Dll Hijacking? Естественно, предпологается, что прога не меняет рабочую директорию и все такое. Просто даже в Вин10 есть такие ветки реестра, поэтому подумал, мб все не так просто и это режится системой?

/dev
24.11.2016
04:55:17
его туда не подмешаешь, у него выборка маленькая слишком.
Всё хорошо тут с машинкой, это как раз тот случай, когда выборка замечательно синтетически генерируется и расширяется

528 вариантов, или я не правильно посчитал?
У жпега блок — 8x8 (смещения символа внутри блока). Шрифт может быть не моноширинным. Символ накрывает здесь (2-3)х(2-3) блока в зависимости от смещения. Для пары, с учётом смещения — 64 варианта. 66х66 пар. 278784 вариантов. Только для пар

Можно сильно упростить модель (а в машинном обучения чем проще модель — тем она устойчивее и меньше переобучается), добавив априорную информацию из задачи, что в каждом блоке — линейная сумма яркостей

Дальше приходим к такой модели. Есть фигуры на пиксельной плоскости, каждая точка лежит в одном из 66 классов плоскость нарезается на блоки 8х8, а яркости внутри блоков усредняются. Это наблюдаемые переменные. Эти фигуры нам известны. P(Y|X) можем выписать. Там не будет нелинейностей (что сыграет на руку для упрощения модели). Дополнительно, ограничения. Символы идут группами в строках — с одинаковой оординатой — добавляем сюда штраф в P(X). В итоге построим модель P(Y,X). Там итоге сведется в линейной системе.

NotABug
24.11.2016
06:25:28
У жпега блок — 8x8 (смещения символа внутри блока). Шрифт может быть не моноширинным. Символ накрывает здесь (2-3)х(2-3) блока в зависимости от смещения. Для пары, с учётом смещения — 64 варианта. 66х66 пар. 278784 вариантов. Только для пар
Да нет же, речь о количестве перестановок, а не о количестве пикселей. Т.е. 1056 перестановок это число всех парных букв (но на самом деле их можно уменьшить, т.к. например не бывает твердого знака впереди слова и проч, но тут с этим сложно, имхо тоже нужно закладывать и в тоже время увеличить с учетом апер и лоуеркейс и знаки препинания). Идея была изначально такая - распознавать комбинацию каждых двух букв.

/dev
24.11.2016
06:26:50
Если были бы нелинейности при наложении, то был бы смысл пару распознаванать. А так — это лишний риск переобучения

Vladimir
24.11.2016
07:56:49
тут проблема в том что буквы расположены близко к друг другу. И если, напримвер букву "А" (пикселизированную) легко определить отдельно. Но, если будет "АБ" это уже будет другой паттерн.
А ещё не забывай, что ширина букв не ровное кол-во пикселей пикселезации, а значит даже для отдельностоящей буквы будет разный паттерн при её смещении (влево-вправо)

учитывая что я знаю шрифт, размер и как производилась пикселизация, я могу так же зашакалить войну и мир. И скормить компьютеру изучать.
что бы не зависеть от смещения надо идти строго по порядку: генеришь все последовательности букв длиной 3 символа и отсекаешь последние 2 пикселя пикселезации. сравниваешь совпадения первых 4-5 пикселей. Вуаля - ты нашел певые 2 буквы. зная первые 2 буквы генеришь все возможные варианты из 4-х символов (тут уже можно по словарю слово искать т.к. вариантов слановится приемлимое количество) и так далее в автоматическом режиме по 1-й букве

Evgeny
24.11.2016
12:10:57
https://m.habrahabr.ru/post/315850/#habracut

End2end везде, понятно почему групповых чатов нет)

Aleksander
24.11.2016
12:20:33
вопрос. это какая-то альтернативная кодировка или просто неправильный вклалыш?

5 = зеленый например но я хоть убей зеленого тут не вижу

CthUlhUzzz
24.11.2016
12:21:44
Что мешает померить?

Fuuss ?
24.11.2016
12:22:46
Что мешает померить?
Вопрос вроде про кодировку был а не про номинал?

CthUlhUzzz
24.11.2016
12:24:17
Для этого разве не нужно узнать реальный номинал резистора?

Может он вообще отличается от всего остального)

Aleksander
24.11.2016
12:26:32
про померить совет был годный. это просто 220 ом на самом деле

спасибо

Leo
24.11.2016
12:27:45
а цветовая маркировка на самом резисторе (те самые полосочки) соответствует тому что намерил?

Google
Aleksander
24.11.2016
12:30:12
да маркировка правильная, вклалыш - нет

Vladimir
24.11.2016
12:36:54
да маркировка правильная, вклалыш - нет
это не факт, приемка не военная, погрешность на резисторах, вроде как до 30% может доходить... так что 220 могут фактический номинал иметь даже 150

Aleksander
24.11.2016
12:37:40
10% насколько я знаю если без золотой полоски

золотая - 5%. или не так?

Vladimir
24.11.2016
12:40:27
а вот не помню... помню, что на резисторах погрешность какая-то дикая была

noobdoesre
24.11.2016
12:41:04
Рад пожаловать к вашему шалашу.

Aleksander
24.11.2016
12:41:42
еще глупый вопрос - припой должен немного кипеть при пайке? или это значит что температура слишком большая? было 350 градусов

MERRON
24.11.2016
12:42:21
О, привет)

noobdoesre
24.11.2016
12:42:53
Говорят, у вас тут жаркие баталии.

Vladimir
24.11.2016
12:44:24
еще глупый вопрос - припой должен немного кипеть при пайке? или это значит что температура слишком большая? было 350 градусов
кипит скорее всего канифоль, которая жилкой внутри проволоки припоя. Если паяешь среднеи высокочастотную штуку, то главное не дуть на припой - он должен остывать максимально долго

Говорят, у вас тут жаркие баталии.
Ага, как правильно паять обсуджаем...

Aleksander
24.11.2016
12:46:51
ок, спасибо. а температура обычно мне какая нужна для схем? а то у меня на станции в градусах, а Поатта в ватах

*Платта

Страница 377 из 1477