Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Как отсканировать библиотеку

Автор Imp, июня 20, 2014, 13:51

0 Пользователи и 2 гостей просматривают эту тему.

antic

Быстрее, это не сканировать отдельно по картинке, а сразу сканировать в режиме создания ПДФ. Конечно, если использовать дорогой профессиональный сканер, где на проход каретки затрачивается несколько секунд и доли секунды на сохранение картинки, то это неактуально, а вот с обычным домашнем сканером, совсем другое дело

PS Собственно, я не понял в чём была причина вопроса: ведь если я написал, что по отдельности долго, то, понятное дело, я имел в виду, что целиком — быстрее
— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

Oleg Grom

Цитата: antic от июня 21, 2014, 11:55
Ну, это слишком дорогой сканер. Бытовые такой скорости не обеспечат
Эээ. Это далеко не самая дорогая МФУшка. На Яндекс маркете отдают за 6268 руб.

Imp

Цитата: Иван-Царевич от июня 21, 2014, 12:02
Цитата: antic от июня 21, 2014, 11:57
Цитата: Иван-Царевич от июня 21, 2014, 11:32
Создания ебука, десу же. Про это ведь речь.
Я не понял, вы что, хотите, чтобы я с нулевого цикла и до полного завершения расписал всю технологическую карту? Слишком это утомительно
Не-не, во-первых, не я, во-вторых, не всю. Просто и мне и Импу интересен ваш алгоритм действий. Вы же сами написали: "это охрененно долго". А как быстрее то?
:+1: Именно это я и хотел сказать. Если то - долго, то как не долго? antic, поделитесь, лютфен
海賊王に俺はなる

Oleg Grom

Цитата: antic от июня 21, 2014, 12:31
Быстрее, это не сканировать отдельно по картинке, а сразу сканировать в режиме создания ПДФ.
И на выходе получать файлы огромного размера и дерьмового качества...

Imp

Цитата: Oleg Grom от июня 21, 2014, 12:34
Цитата: antic от июня 21, 2014, 12:31
Быстрее, это не сканировать отдельно по картинке, а сразу сканировать в режиме создания ПДФ.
И на выходе получать файлы огромного размера и дерьмового качества...
Блин, люди, скажите, как лучше отсканировать книгу, например, африкаанс-русский словарь, чтобы в конце получился не самых монструозных размеров, но чистенький и напоминающий оригинал PDF файл формата чуть боле А4, по которому можно было бы делать поиск, как на африкаанс, так и на русском

И ещё какой принтер купить в пределах тыщ так +/-10, чтобы быстро и качественно это делал
海賊王に俺はなる

Иван-Царевич

Цитата: Imp от июня 21, 2014, 12:39
Цитата: Oleg Grom от июня 21, 2014, 12:34
Цитата: antic от июня 21, 2014, 12:31
Быстрее, это не сканировать отдельно по картинке, а сразу сканировать в режиме создания ПДФ.
И на выходе получать файлы огромного размера и дерьмового качества...
Блин, люди, скажите, как лучше отсканировать книгу, например, африкаанс-русский словарь, чтобы в конце получился не самых монструозных размеров, но чистенький и напоминающий оригинал PDF файл формата чуть боле А4, по которому можно было бы делать поиск, как на африкаанс, так и на русском

И ещё какой принтер купить в пределах тыщ так 10, чтобы быстро и качественно это делал
Бро, ну вот мы на той странице писали про распознавание сфотографированных файлов в файне. Тебе туда. Правда я не знаю насколько хорошо файн сможет распарсить отсканенные пдфы, но, если попытаться получить более-менее четкий скан, то возможность распознавания велика.
Нащот принтира: я юзаю ХыПы, дескджет кажись. Хрен знает, какая модель, но юзается кошерно, причем, если учитывать его семилетний возраст, то вообще просто збс.

antic

Цитата: Imp от июня 21, 2014, 12:33
Если то - долго, то как не долго?
Я специально не измерял, мне в редких случаях приходится отдельные страницы по картинкам делать, а также обложки книг. Целиком книгу в картинках я не делал.


Цитата: Oleg Grom от июня 21, 2014, 12:34
файлы огромного размера
После оптимизации они существенно уменьшаются
Огромного - вы какого имеете в виду?

Цитата: Oleg Grom от июня 21, 2014, 12:34
дерьмового качества
Вы считаете, что дежавюшное качество лучше пдфного? Я бы так не сказал. Не могли бы вы привести данные независимых экспертов по сравнению качества ПДФ и дежавю?
— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

antic

Цитата: Иван-Царевич от июня 21, 2014, 12:44
Цитата: Imp от июня 21, 2014, 12:39
Цитата: Oleg Grom от июня 21, 2014, 12:34
Цитата: antic от июня 21, 2014, 12:31
Быстрее, это не сканировать отдельно по картинке, а сразу сканировать в режиме создания ПДФ.
И на выходе получать файлы огромного размера и дерьмового качества...
Блин, люди, скажите, как лучше отсканировать книгу, например, африкаанс-русский словарь, чтобы в конце получился не самых монструозных размеров, но чистенький и напоминающий оригинал PDF файл формата чуть боле А4, по которому можно было бы делать поиск, как на африкаанс, так и на русском

И ещё какой принтер купить в пределах тыщ так 10, чтобы быстро и качественно это делал
Бро, ну вот мы на той странице писали про распознавание сфотографированных файлов в файне.

Имеется в виду Файнридер? Честно говоря, с Файнридером для меня не всё понятно. Можно ли с его помощью всунуть ОЦР-слой в графический ПДФ? У меня Файнридер 8, я там такой возможности не нашел, если сохранять как ПДФ, то он делает в режиме текстового ПДФ, а в таком случае ПДФ вроде и нафик не нужен, проще тогда  как ДОК сохранить
— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

Alexandra A

Цитата: Иван-Царевич от июня 21, 2014, 11:54
Цитата: Oleg Grom от июня 21, 2014, 11:49
Цитата: Alexandra A от июня 21, 2014, 11:37
Можно ли книгу сфотографировать на мобильный телефон, потом полученные изображения перевести в .pdf, а потом сделать так чтобы в .pdf можно было копировать текст с помощью Ctrl+C Ctrl+V и перенести его в Microsoft Word?
Если камера на телефоне приличная и способна выдать качество картинки, приемлемое для распознавания файнридером, то да.
Ей же именно копировать текст надо, чтобы как в Вёрде было. А файн вроде не все символы распознает. У меня только один раз толково получилось. При фотографировании для таких дел надо, как минимум, соблюдать несколько правил: разрешение около трёхсот точек на дюйм, повышенная резкость, и нормальная яркость.
Вы не поняли.

Мне не нужен "текст как в Ворде." Мне нужен текст который потом можно перенести в Ворд и из Ворда распечатать.

Весь смысл копирования (сканнером, телефоном) - это сделать такой файл, чтобы потом текст можно было напечатать на принтере. Хорошо. если это будет .pdf котрый распознаёт текст как текст (а не как картинку) - текст который можно копировать при желании. Лучше, если это будет документ Ворда, текст которого скопирован из файла .pdf с помощью Ctrl+C Ctrl+V.
taximagulus segouax caius iulius kent 25 august 55 before the common era
marcus tullius quintus tullius arpinum 6 may 51 before the common era

Alexandra A

Цитата: Oleg Grom от июня 21, 2014, 11:49
Цитата: Alexandra A от июня 21, 2014, 11:37
Можно ли книгу сфотографировать на мобильный телефон, потом полученные изображения перевести в .pdf, а потом сделать так чтобы в .pdf можно было копировать текст с помощью Ctrl+C Ctrl+V и перенести его в Microsoft Word?
Если камера на телефоне приличная и способна выдать качество картинки, приемлемое для распознавания файнридером, то да.
Fine Reader - это класс различных программ, раных кмопаний и авторов?

ST+ - это один из файн ридеров?
taximagulus segouax caius iulius kent 25 august 55 before the common era
marcus tullius quintus tullius arpinum 6 may 51 before the common era

Иван-Царевич

Цитата: Alexandra A от июня 21, 2014, 13:09
Цитата: Иван-Царевич от июня 21, 2014, 11:54
Цитата: Oleg Grom от июня 21, 2014, 11:49
Цитата: Alexandra A от июня 21, 2014, 11:37
Можно ли книгу сфотографировать на мобильный телефон, потом полученные изображения перевести в .pdf, а потом сделать так чтобы в .pdf можно было копировать текст с помощью Ctrl+C Ctrl+V и перенести его в Microsoft Word?
Если камера на телефоне приличная и способна выдать качество картинки, приемлемое для распознавания файнридером, то да.
Ей же именно копировать текст надо, чтобы как в Вёрде было. А файн вроде не все символы распознает. У меня только один раз толково получилось. При фотографировании для таких дел надо, как минимум, соблюдать несколько правил: разрешение около трёхсот точек на дюйм, повышенная резкость, и нормальная яркость.
Вы не поняли.

Мне не нужен "текст как в Ворде." Мне нужен текст который потом можно перенести в Ворд и из Ворда распечатать.

Весь смысл копирования (сканнером, телефоном) - это сделать такой файл, чтобы потом текст можно было напечатать на принтере. Хорошо. если это будет .pdf котрый распознаёт текст как текст (а не как картинку) - текст который можно копировать при желании. Лучше, если это будет документ Ворда, текст которого скопирован из файла .pdf с помощью Ctrl+C Ctrl+V.
Я про это и говорил. Имелась ввиду возможность переноса текста куда-либо.

Alexandra A

Сканера у меня нет, а вот мобильный телефон есть.

Что надо сделать чтобы сфотографировать страницу книги мобильным телефоном и потмо перенести в Ворд?

Какие программы я должна установить?

Я уже установила Scan Tailor 0.9.11.1 (ST+ или ST Enhanced - не знаю).
taximagulus segouax caius iulius kent 25 august 55 before the common era
marcus tullius quintus tullius arpinum 6 may 51 before the common era

Oleg Grom

Цитата: antic от июня 21, 2014, 12:45
Не могли бы вы привести данные независимых экспертов по сравнению качества ПДФ и дежавю?
Любой человек мало мальски серьезно занимавшийся оцифровкой книг вам это скажет. Есть только один случай когда pdf однозначно решает - изначально компьютерная верстка. Отсканированную книгу конечно можно распознать, вычитать и переверстать, но геморроя столько, что мало кто этим занимается.

antic

Цитата: Alexandra A от июня 21, 2014, 13:20
Какие программы я должна установить?
Любую распознавалку текстов. Насколько я понимаю, самой крутой распознавалкой считается Файнридер, но он платный
— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

antic

Цитата: Oleg Grom от июня 21, 2014, 13:27
Цитата: antic от июня 21, 2014, 12:45
Не могли бы вы привести данные независимых экспертов по сравнению качества ПДФ и дежавю?
Любой человек мало мальски серьезно занимавшийся оцифровкой книг вам это скажет.
Мне не интересно мнение любого любителя, который решил, что для него лично больше подходит дежавю. Если вы считаете себя специалистом в этом вопросе, то, пожалуйста выдайте объективные формализованные характеристики, определяющие качество
— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

Oleg Grom

Alexandra A,

Эту книжку я сфоткал лет 5 назад на "мыльницу" по характеристикам сравнимую с камерам на современных смартфонах средней ценовой категории. Вот подложенный под картинку текст по которому осуществляется поиск и который можно копировать:

Imp

Возможно качество у пдф и дежавю разное, но я очень много пользуюсь файлами на айпаде и у меня есть очень хорошая программа для файлов пдф, с дежавю труднее, поэтому лично мне дежавю не подходит совсем
海賊王に俺はなる

Oleg Grom

Цитата: antic от июня 21, 2014, 13:32
Мне не интересно мнение любого любителя, который решил, что для него лично больше подходит дежавю. Если вы считаете себя специалистом в этом вопросе, то, пожалуйста выдайте объективные формализованные характеристики, определяющие качество
http://www.djvu-soft.narod.ru/ Там же есть форум, где можно пообщаться со "специалистами" по технической стороне сканообработки.

Alexandra A

Цитата: Oleg Grom от июня 21, 2014, 13:38
Alexandra A,

Эту книжку я сфоткал лет 5 назад на "мыльницу" по характеристикам сравнимую с камерам на современных смартфонах средней ценовой категории. Вот подложенный под картинку текст по которому осуществляется поиск и который можно копировать:
Спасибо.

Так как это делается? С помощью Scan Tailor? Все программы были бесплатные?

Да, это то что нужно. Книжка сфотографирована - а вот теперь есть текст который можно копировать и переносить куда угодно для распечатки.
taximagulus segouax caius iulius kent 25 august 55 before the common era
marcus tullius quintus tullius arpinum 6 may 51 before the common era

antic

Цитата: Oleg Grom от июня 21, 2014, 13:52
http://www.djvu-soft.narod.ru/ Там же есть форум, где можно пообщаться со "специалистами" по технической стороне сканообработки.
Узнавать о преимуществе дежавю на форуме дежавюшников, это то же самое, что узнавать о преимуществах крепостного строя в уездном дворянском собрании
— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

Bhudh

Цитата: Alexandra A от июня 21, 2014, 13:12Fine Reader - это класс различных программ, раных кмопаний и авторов?

ST+ - это один из файн ридеров?
Александра, Вы в интернете или где⁈
ABBYY FineReader — это лицензионный продукт компании ABBYY, той же, что создала и PDF Transformer, список поддерживаемых языков из какой я показывал.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

dragun97yu

Дежавю лучше, ибо они размером меньше.
Хотя с ПО есть проблемы. На iOS, например, единственный ридер мне не понравился.
Скопка - это маленькая скопа.

Bhudh

Меньше, если нормально сделаны. Про DjVuʼшки на веб-архиве, к сожалению, этого сказать нельзя, там и побольше pdfʼок размером встречаются.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

dragun97yu

Скопка - это маленькая скопа.

antic

— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

 

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр