Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Обработка изображений. Подскажите

Автор Тайльнемер, января 15, 2012, 08:02

0 Пользователи и 1 гость просматривают эту тему.

Тайльнемер

Время от времени мне попадается что-нибудь вроде снятого фотоаппаратом/телефоном текста, который хотелось бы привести в божеский вид. Конкретно — сделать чёрный текст на белом фоне, например, для распечатки на принтере.

В отличие от сканов(,) фотографии текста обычно бывают неравномерно освещены. То есть, градиентный фон от светло-серого к средне-серому и текст на нём от средне-серого к тёмно-серому.

Если вывести тоновой кривой (или яркостью-контрастностью) фон в тёмном месте фотографии к белому, то светлая часть фотографии становится полностью белой; а если вывести текст светлой части к чёрному, то тёмная часть становится полностью чёрной. Т. е., в обоих случаях часть текста становится нечитаемой.

«Нахождение границ» замечательно выделяет текст из фона, но вот буквы становятся пустыми внутри.

Как в таких случаях действовать?

Hellerick

Сейчас у меня под рукой нет Фотошопа...

Кажется я пробовал использовать фильтр «maximum» — он позволял получать «чистый» неравномерно освещенный белый лист с убранным текстом.

Потом можно было вычесть «чистый лист» из основного изображения, и получить текст на белом фоне.

Правда не помню, насколько это было эффективно.

mnashe

Я пока не нашёл решения.
Выделял ярко освещённую середину, сильно размывал выделение, инвертировал его, затем поднимал яркость периферии. Иногда несколько раз.
Но это не дело — трудоёмко и результат не идеален. Я просто переносил на «камеросканы» опыт работы с нормальными фотографиями.

Цитата: Hellerick от января 15, 2012, 08:19
Кажется я пробовал использовать фильтр «maximum» — он позволял получать «чистый» неравномерно освещенный белый лист с убранным текстом.
Потом можно было вычесть «чистый лист» из основного изображения, и получить текст на белом фоне.
Интересно, надо попробовать.

А ScanKromsator / ScanTailor не справляются с камеросканами?
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!


rafa


mnashe

Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

Tweet

Я предпочитаю применить фильтр несколько раз с разными параметрами (и/или изменить контраст с разными параметрами несколько раз) и использовать маски слоёв, чтобы сохранить именно ту часть слоя, где он хорошо вышел.

mnashe

Цитата: rafa от января 15, 2012, 09:32
то надо результат выделения воплотить в чб изображение и волшебной палкой  выделить полости ынутри букв и залить их черным...
А ничё, что палкой придётся взмахнуть пару тысяч раз на страницу?
Ну или, если тыкать, наоборот, в белое, то один раз снаружи букв и сотни раз — на дырки в абвдеорфхъыьюя.
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

mnashe

Цитата: Demetrius от января 15, 2012, 09:46
и использовать маски слоёв, чтобы сохранить именно ту часть слоя, где он хорошо вышел
А что такое «маски слоёв» и «часть слоя»?
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

Oleg Grom

Пользуйтесь scantailor'омъ (только версіи изъ git) или bookrestorer'омъ.

rafa

Цитата: Oleg Grom от января 15, 2012, 10:17
Пользуйтесь scantailor'омъ (только версіи изъ git) или bookrestorer'омъ.

дауш зачем фотошоп коды есть для людей такие софты

Hellerick

Сделал для исходного изображения два слоя-копии.

Оба слоя-копии размыл по Гауса при радиусе два пикселя.

Один слой подверг фильтру «максимум», а другой — «минимум» (при 20-пиксельной радиусе).

Светлый слой, который был над начальным изображением, настроил на показ в режиме «роазница». Слил его с начальным изображением и сделал его инверсию.

Темный слой настроил на режим «жесткое смещение» и тоже слил с основным изображением.

Отчернобелил картинку.

Все операции делаются «не глядя», а значит, могут быть автоматизированны макросом.

Offtop
Ненавижу русский интрефейс Фотошопа.

Hellerick


mnashe


Ух ты! Отличный результат, намного лучше моего — и проще.
А зачем нужно два слоя, максимум и минимум?

Цитата: Hellerick от января 15, 2012, 10:22
Offtop
Ненавижу русский интрефейс Фотошопа.
:+1:
Никак не соображу, что ж такое «жёсткое смещение».
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

Тайльнемер

Цитата: mnashe от января 15, 2012, 08:43
А ScanKromsator / ScanTailor не справляются с камеросканами?
Цитата: Oleg Grom от января 15, 2012, 10:17
Пользуйтесь scantailor'омъ (только версіи изъ git) или bookrestorer'омъ.
Круто. Спасибо за такую прогу. Испробую.

Hellerick

Цитата: mnashe от января 15, 2012, 10:30
А зачем нужно два слоя, максимум и минимум?

Слой с максимумом осветляет бумагу, слой с минимумом затемняет буквы.

Ах да, я забыл еще одно действие — после инвертирования нужно сделать autocolors, или как там это называется, чтобы изображение не было таким серушным.

mnashe

Цитата: Hellerick от января 15, 2012, 10:37
autocolors, или как там это называется
Auto levels или что-то в этом духе, точно не помню.

Я ещё не пробовал ST, раньше SK пользовался. Говорят, ST намного проще в настройках. Интересно, как он с моим пациентом справится.
Если справится, надо будет ему словарь Кляйна скормить (460-тонный PDF).
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!


mnashe

Отлично! Справился вполне.
Значит, надо срочно его устанавливать и обрабатывать Кляйна. Ну, и эту статью наконец смогу дочитать.
Пришлось повозиться с настройками, или всё по дефолту?
А что такое «только версіи изъ git»?
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

Oleg Grom

Цитата: mnashe от января 15, 2012, 11:20
Пришлось повозиться с настройками, или всё по дефолту?
Все по дефолту. Единственное, что я въ ручную задалъ dpi и сдѣлалъ поля чуть больше, т.к. при исправленіи перекоса строкъ "съѣдался" кусокъ текста. Изъ практики: иногда можетъ потребоваться вручную поправить перекосъ строкъ или вообще его отключить, ну и можетъ еще что-то специфическое для конкретныхъ снимковъ.
Цитата: mnashe от января 15, 2012, 11:20
А что такое «только версіи изъ git»?
Это разрабатываемая, предрелизная версія. Сборки для Windows можно брать тутъ: http://sourceforge.net/projects/scantailor/files/scantailor-devel/plus/

mnashe

Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

mnashe

Вот первый блин.
Посмотрите, что можно было улучшить настройками?
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

Oleg Grom

Цитата: mnashe от января 15, 2012, 23:27
Вот первый блин.
Посмотрите, что можно было улучшить настройками?
Для начала я бы принудительно задал меньший dpi для исходных файлов, скажем 150 и немного увеличил поля. Потом стоило бы поиграться с порогом бинаризации для отдельных страниц. Там где получается "мазня" можно попробовать предварительно помучить оригинальные изображения в фотошопе, иногда это помогает.

mnashe

Спасибо!
Я как раз поставил 600 для исходных файлов. Не знал, что это может повредить.
Поля я подрезал потом в ручную, поскольку ST почему-то их огромными сделал.
А, знаю, почему: я где-то недоглядел (не срезал) мазню слева, и он все страницы под это отразмерил.
Можно было бы потом выровнять всё, но мне было лень, это ж так, для опыта.
Кстати, меня удивило, что ST выделил текст от фонаря на половине страниц (потеряв кое-где аж треть страницы), пришлось размечать всё вручную.
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

Oleg Grom

Цитата: mnashe от января 16, 2012, 19:12
Я как раз поставил 600 для исходных файлов. Не знал, что это может повредить.
Вообще есть способ вычислить правильное разрешение для каждой конкретной фотографии. Вот здесь об этом говорится - http://vimeo.com/12527484
Цитата: mnashe от января 16, 2012, 19:12
Поля я подрезал потом в ручную, поскольку ST почему-то их огромными сделал.
Это потому что полезная область на какой-то страницы оказалась больше чем у других. Для фотографированных книг лучше всего снимать галочку с mtch size with other pages.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр