Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Как отсканировать библиотеку

Автор Imp, июня 20, 2014, 13:51

0 Пользователи и 1 гость просматривают эту тему.

Imp

Народ, поможите советом:

Я дожил до такого момента, когда книги явно уже начали мешать нормальной жизнедеятельности, слишком их много у меня расплодилось. Короче, перед тем как их куда-то запрятать мне их отсканировать нужно, а я ни разу ничем подобным не занимался. В современных технологиях я такой юзер среднего пошиба.

Мне сейчас нужен хороший сканер для книг, причём для большеформатных словарей тоже. Подскажите, что искать, на что обращать внимание, какой фирмы. Цена, в пределах разумного, не столь важна, сколько качество, лёгкость и скорость сканирования.

И ещё прочитал я тут о расчудесной технологии OCR, когда можно будет делать поиск по тексту в отсканированном документе, мне это прямо оченя нужно. Скажите, что для этого надо, в аппаратном, программном и любом другом смысле.

Заранее всем огромное спасибо за советы по делу!
海賊王に俺はなる

antic

Современные бытовые сканеры (точнее, их оболочки) позволяют сразу же создавать ПДФ с ОЦР. Формат у них, как правило, чуть больше А4, т. е. практически все словари влезают, а также большеформатная специальная литература (а вот увражи — далеко не все)
— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

Imp

Цитата: antic от июня 20, 2014, 14:07
Современные бытовые сканеры (точнее, их оболочки) позволяют сразу же создавать ПДФ с ОЦР. Формат у них, как правило, чуть больше А4, т. е. практически все словари влезают, а также большеформатная специальная литература (а вот увражи — далеко не все)
Спасибо!

У меня в основном тексты, картинки мне далеко не так важны. И да, лучше чуть больше А4

А конкретно по модели или фирме не посоветуете? Чтобы быстро и качественно работал
海賊王に俺はなる

Alexandra A

А как потом сделать так, чтобы текст в формате .pdf можно было выделять мышкой, и копировать с помощью Ctrl+C Ctrl+V в документ Microsoft Word?
taximagulus segouax caius iulius kent 25 august 55 before the common era
marcus tullius quintus tullius arpinum 6 may 51 before the common era

antic

Я лично юзаю Canon LIDE 100, меня вполне устраивает. Про другие не могу сказать, но параметры, насколько я понимаю, у всех бытовых сканеров примерно одинаковые, формат у всех чуть больше А4. Для большого формата нужно брать офисный сканер, но я вам не советую. Кроме того, что они дороже, нужно ещё учитывать удобство в работе. Для того, чтобы сканировать многостраничные книги, сканер должен занимать как можно меньше места на столе, и быть как можно более плоским. Дело в том, что когда вы сканируете книгу, вам необходимо её плотно прижимать руками к стеклу (кстати, крышку закрывать необязательно, если нет прямого сильного внешнего освещения, бьющего прямо в стекло). Если вам будет неудобно сидеть и прижимать каждый раз руками книгу, то вы много не насканируете, будете уставать.
— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

Imp

Цитата: Alexandra A от июня 20, 2014, 14:24
А как потом сделать так, чтобы текст в формате .pdf можно было выделять мышкой, и копировать с помощью Ctrl+C Ctrl+V в документ Microsoft Word?
Я так понимаю, что эта же технология OCR позволяет это делать
海賊王に俺はなる

Imp

Цитата: antic от июня 20, 2014, 14:26
Я лично юзаю Canon LIDE 100, меня вполне устраивает. Про другие не могу сказать, но параметры, насколько я понимаю, у всех бытовых сканеров примерно одинаковые, формат у всех чуть больше А4. Для большого формата нужно брать офисный сканер, но я вам не советую. Кроме того, что они дороже, нужно ещё учитывать удобство в работе. Для того, чтобы сканировать многостраничные книги, сканер должен занимать как можно меньше места на столе, и быть как можно более плоским. Дело в том, что когда вы сканируете книгу, вам необходимо её плотно прижимать руками к стеклу (кстати, крышку закрывать необязательно, если нет прямого сильного внешнего освещения, бьющего прямо в стекло). Если вам будет неудобно сидеть и прижимать каждый раз руками книгу, то вы много не насканируете, будете уставать.
Спасибо, а что сканеры разве бывают не плоскими? Или вы имеете ввиду крышку и внешний дизайн?
海賊王に俺はなる

Hellerick

Цитата: Imp от июня 20, 2014, 14:34
Спасибо, а что сканеры разве бывают не плоскими?
Есть сканеры с двумя сканируемыми плоскостями, расположенными градусов под 150 -- это существенно улучшает качество сканирования в зоне переплета.

Лом d10

Цитата: Hellerick от июня 20, 2014, 14:40
Цитата: Imp от июня 20, 2014, 14:34
Спасибо, а что сканеры разве бывают не плоскими?
Есть сканеры с двумя сканируемыми плоскостями, расположенными градусов под 150 -- это существенно улучшает качество сканирования в зоне переплета.
какого dpi достаточно для текста и какого для картинок?

Imp

Цитата: Hellerick от июня 20, 2014, 14:40
Цитата: Imp от июня 20, 2014, 14:34
Спасибо, а что сканеры разве бывают не плоскими?
Есть сканеры с двумя сканируемыми плоскостями, расположенными градусов под 150 -- это существенно улучшает качество сканирования в зоне переплета.
А вот это интересно! Посоветуйте уже конкретную модель, пожалуйста
海賊王に俺はなる

antic

Цитата: Imp от июня 20, 2014, 14:34
Спасибо, а что сканеры разве бывают не плоскими?
Я имел в виду, чтобы он как можно более тонким был, чтобы руки удобней лежали.

Цитата: Hellerick от июня 20, 2014, 14:40
Есть сканеры с двумя сканируемыми плоскостями
Я таких не видел, но если они есть, то, вероятно, это должно быть удобно, хотя, по-настоящему можно оценить, только попробовав, потому что, кто его знает, а вдруг наоборот, неудобно.

Цитата: Лом d10 от июня 20, 2014, 15:03
какого dpi достаточно для текста и какого для картинок?
Если вы сканируете текст в черно-белом режиме, то в большинстве случаев наиболее рационально использовать 300, ежели в сером или цветном, то хватит 200. Для обычных иллюстраций в технических текстах хватит 200, если нужно отсканировать хорошие иллюстрации с очень мелкими деталями или географические карты, то лучше 300. Большее разрешение графики имеет смысл использовать только если вам нужно будет рассматривать уж совсем мелкие детали, т. е. как через увеличительное стекло
— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

Imp

Цитата: Лом d10 от июня 20, 2014, 15:03
Цитата: Hellerick от июня 20, 2014, 14:40
Цитата: Imp от июня 20, 2014, 14:34
Спасибо, а что сканеры разве бывают не плоскими?
Есть сканеры с двумя сканируемыми плоскостями, расположенными градусов под 150 -- это существенно улучшает качество сканирования в зоне переплета.
какого dpi достаточно для текста и какого для картинок?
Мне тоже интересно, если я хочу очень хорошее качество для текста, сколько нужно этого dpi
海賊王に俺はなる

Bhudh

Цитата: Alexandra A от июня 20, 2014, 14:24А как потом сделать так, чтобы текст в формате .pdf можно было выделять мышкой, и копировать с помощью Ctrl+C Ctrl+V в документ Microsoft Word?
Цитата: Imp от июня 20, 2014, 14:32Я так понимаю, что эта же технология OCR позволяет это делать
Не "позволяет", а это она и есть.
OCR = optical character recognition = Оптическое распознавание символов
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Alexandra A

Цитата: Bhudh от июня 20, 2014, 16:32
Цитата: Alexandra A от июня 20, 2014, 14:24А как потом сделать так, чтобы текст в формате .pdf можно было выделять мышкой, и копировать с помощью Ctrl+C Ctrl+V в документ Microsoft Word?
Цитата: Imp от июня 20, 2014, 14:32Я так понимаю, что эта же технология OCR позволяет это делать
Не "позволяет", а это она и есть.
OCR = optical character recognition = Оптическое распознавание символов
Для Windows 7 есть бесплатные программы которые занимаются OCR - оптическим распознаванием символов?

Мне в принципе текст книги прежде всего нужен... Его можно напечатать и в Микрософт Ворде.
taximagulus segouax caius iulius kent 25 august 55 before the common era
marcus tullius quintus tullius arpinum 6 may 51 before the common era

Лом d10

Цитата: Bhudh от июня 20, 2014, 16:32
Цитата: Alexandra A от июня 20, 2014, 14:24А как потом сделать так, чтобы текст в формате .pdf можно было выделять мышкой, и копировать с помощью Ctrl+C Ctrl+V в документ Microsoft Word?
Цитата: Imp от июня 20, 2014, 14:32Я так понимаю, что эта же технология OCR позволяет это делать
Не "позволяет", а это она и есть.
OCR = optical character recognition = Оптическое распознавание символов
ФайнРидер?

Imp

Я тут начал читать тыр-нет, говорят, что важно чтобы крышка была настолько подвижной, чтобы могла закрыть книгу сверьху. Ещё говорят, что пыль может быстро попадать внутрь сканера и это типа как не комильфо.

Canon вроде как неплохой, но он универсальный, для всего, хорошо бы услышать тех, кто именно книги много сканирует
海賊王に俺はなる

Hellerick

Решил посмотреть, какие бывают дешевые "ломанные" сканеры, и наткнулся на это:



Любопытно.

Alexandra A

Цитата: Hellerick от июня 20, 2014, 17:44
Решил посмотреть, какие бывают дешевые "ломанные" сканеры, и наткнулся на это:



Любопытно.
Как там книгу положить? Обложкой вниз и печатным текстом вверх?

И где сканирующее устройство? Наверху?
taximagulus segouax caius iulius kent 25 august 55 before the common era
marcus tullius quintus tullius arpinum 6 may 51 before the common era

Oleg Grom

Если предполагается сканировать дофига и больше, то прежде свего надо смотреть на скорость сканирования на 300 дпи в оттенках серого. Отсканированное скармливается программе scantailor, затем собирается с помощью djvusmall и при необходимости распознается связкой Fine Reader (8 версии) и djvuocr.
Цитата: Alexandra A от июня 20, 2014, 17:49
И где сканирующее устройство? Наверху?
Там фактически дофигамегапиксельная камера.

Oleg Grom

Цитата: Imp от июня 20, 2014, 17:07
Ещё говорят, что пыль может быстро попадать внутрь сканера и это типа как не комильфо.
У меня стареький сканер. Там и пыль и подтеки на стекле и царапины. Заметно это только на цветных картинках при большом увеличении.

Oleg Grom

http://aluarium.net/forum/thread-432-post-5821.html#pid5821

Вот тут описание самого простого способа сделать электронную книгу в приличномм виде.

Imp

Цитата: Oleg Grom от июня 20, 2014, 18:15
http://aluarium.net/forum/thread-432-post-5821.html#pid5821

Вот тут описание самого простого способа сделать электронную книгу в приличномм виде.
Да, спасибо большое!

А как быть с этим : "выбираем подходящий язык распознавания", если у меня таджикско-русский или, прости господи, уйгурско-английский (с арабицей) словарь?
海賊王に俺はなる

mnashe

Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

Alexandra A

Цитата: Oleg Grom от июня 20, 2014, 18:15
http://aluarium.net/forum/thread-432-post-5821.html#pid5821

Вот тут описание самого простого способа сделать электронную книгу в приличномм виде.
А что лучше:

Scantailor+ или Scantailor Enhanced?
taximagulus segouax caius iulius kent 25 august 55 before the common era
marcus tullius quintus tullius arpinum 6 may 51 before the common era

Imp

Цитата: mnashe от июня 20, 2014, 19:31
Offtop
Как тема попала в ПР? :what:
Не знаю :P ну перенеси куда надо, если тут неправильно

А уже перенёс. Тода!
海賊王に俺はなる

 

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр