Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.
Ограничения: максимум вложений в сообщении — 3 (3 осталось), максимальный размер всех файлов — 300 КБ, максимальный размер одного файла — 100 КБ
Снимите пометку с вложений, которые необходимо удалить
Перетащите файлы сюда или используйте кнопку для добавления файлов
Вложения и другие параметры
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр

Сообщения в этой теме

Автор mnashe
 - января 24, 2012, 08:26
Обработал вчера Кляйна (этимологический словарь иврита).
Из 460 MB pdf (фотографии 753 страниц) вышел 62 MB djvu.
Потратил на кадрирование почти 6 часов, так как больше половины страниц StanTailor не смог правильно выделить автоматически.
И это ещё не всё, придётся вечером продолжить — с раскривлением страниц он не справился, придётся размечать вручную. Ещё 5–6 часов работы... :(
Странно, что в короткой статье из 30 страниц он успешно раскривил фотографированные страницы, а тут — никак. Даже наоборот, пару ровных страниц в начале книги искривил.
Кроме искривления, качество нареканий не вызывает: всё, что можно было извлечь из оригинала, он извлёк, читать так намного приятнее, а уж про размер и говорить нечего.
На UZ лежит ужатый до 100 MB вариант этого 460 MB pdf — так там вообще почти нечитабельно из-за jpeg-артефактов. Посмотрел и стёр.
Автор Тайльнемер
 - января 17, 2012, 04:26
Отличная программа.
Я в качестве эксперимента перевёл книгу по баскской фонетике из темы Баскский-1: ударение из 55-мегабайтного pdf'a в 1,7-мегабайтное djvu:

http://teilnehmer.host.org/misc/docs/BasquePhonology.djvu
Автор Oleg Grom
 - января 16, 2012, 22:05
Цитата: mnashe от января 16, 2012, 21:20
Действительно. Одну снимут прямо, другую под углом...
Там не в этом дело. Если снимать не со штатива, то получается разное расстояние до объекта съемки, соответстеннно надо либо колдовать с dpi, либо как-то извращаться параметрами полей при обработке.
Автор mnashe
 - января 16, 2012, 21:20
Цитата: Oleg Grom от января 16, 2012, 19:28
Для фотографированных книг лучше всего снимать галочку с mtch size with other pages.
Действительно. Одну снимут прямо, другую под углом...
Автор Oleg Grom
 - января 16, 2012, 19:28
Цитата: mnashe от января 16, 2012, 19:12
Я как раз поставил 600 для исходных файлов. Не знал, что это может повредить.
Вообще есть способ вычислить правильное разрешение для каждой конкретной фотографии. Вот здесь об этом говорится - http://vimeo.com/12527484
Цитата: mnashe от января 16, 2012, 19:12
Поля я подрезал потом в ручную, поскольку ST почему-то их огромными сделал.
Это потому что полезная область на какой-то страницы оказалась больше чем у других. Для фотографированных книг лучше всего снимать галочку с mtch size with other pages.
Автор mnashe
 - января 16, 2012, 19:12
Спасибо!
Я как раз поставил 600 для исходных файлов. Не знал, что это может повредить.
Поля я подрезал потом в ручную, поскольку ST почему-то их огромными сделал.
А, знаю, почему: я где-то недоглядел (не срезал) мазню слева, и он все страницы под это отразмерил.
Можно было бы потом выровнять всё, но мне было лень, это ж так, для опыта.
Кстати, меня удивило, что ST выделил текст от фонаря на половине страниц (потеряв кое-где аж треть страницы), пришлось размечать всё вручную.
Автор Oleg Grom
 - января 16, 2012, 18:26
Цитата: mnashe от января 15, 2012, 23:27
Вот первый блин.
Посмотрите, что можно было улучшить настройками?
Для начала я бы принудительно задал меньший dpi для исходных файлов, скажем 150 и немного увеличил поля. Потом стоило бы поиграться с порогом бинаризации для отдельных страниц. Там где получается "мазня" можно попробовать предварительно помучить оригинальные изображения в фотошопе, иногда это помогает.
Автор mnashe
 - января 15, 2012, 23:27
Вот первый блин.
Посмотрите, что можно было улучшить настройками?
Автор mnashe
 - января 15, 2012, 11:58
Спасибо!
Автор Oleg Grom
 - января 15, 2012, 11:31
Цитата: mnashe от января 15, 2012, 11:20
Пришлось повозиться с настройками, или всё по дефолту?
Все по дефолту. Единственное, что я въ ручную задалъ dpi и сдѣлалъ поля чуть больше, т.к. при исправленіи перекоса строкъ "съѣдался" кусокъ текста. Изъ практики: иногда можетъ потребоваться вручную поправить перекосъ строкъ или вообще его отключить, ну и можетъ еще что-то специфическое для конкретныхъ снимковъ.
Цитата: mnashe от января 15, 2012, 11:20
А что такое «только версіи изъ git»?
Это разрабатываемая, предрелизная версія. Сборки для Windows можно брать тутъ: http://sourceforge.net/projects/scantailor/files/scantailor-devel/plus/