Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Как отсканировать библиотеку

Автор Imp, июня 20, 2014, 13:51

0 Пользователи и 1 гость просматривают эту тему.

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Imp

Цитата: Bhudh от июня 21, 2014, 14:47
В чём портабельность? Для Линуха нет читалок? :o
Дежавю объективно менее распространены и для них меньше программ, их намного реже могут читать ридеры, если вообще хоть какие-то могут
海賊王に俺はなる

dragun97yu

Цитата: Imp от июня 21, 2014, 14:52
Дежавю объективно менее распространены и для них меньше программ, их намного реже могут читать ридеры, если вообще хоть какие-то могут
Ридеры на Windows, MacOS и Linux точно есть.
Скопка - это маленькая скопа.

Bhudh

Цитата: Imp от июня 21, 2014, 14:52их намного реже могут читать ридеры
Всмысле хардовые читалки? Электронные книжки?
Ибо для компа софт для них чаще всего раздельный.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Imp

Цитата: Bhudh от июня 21, 2014, 14:53
Цитата: Imp от июня 21, 2014, 14:52их намного реже могут читать ридеры
Всмысле хардовые читалки? Электронные книжки?
Ибо для компа софт для них чаще всего раздельный.
Да да электронные читалки для книжек
海賊王に俺はなる

dragun97yu

Цитата: Imp от июня 21, 2014, 14:55
Цитата: Bhudh от июня 21, 2014, 14:53
Цитата: Imp от июня 21, 2014, 14:52их намного реже могут читать ридеры
Всмысле хардовые читалки? Электронные книжки?
Ибо для компа софт для них чаще всего раздельный.
Да да электронные читалки
Я могу с уверенностью сказать, что современные читалки будут поддерживать Djvu.
Скопка - это маленькая скопа.

Bhudh

Ну за это монстра по имени Adobe надо благодарить.
Первоначально PDF для читалок тоже не предназначался, там свои форматы: E-Pub, Mobi и т. п.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Imp

Могу рассказать о своём опыте: на яблочном айпаде замечательно и без проблем читаются pdf файлы, для них есть масса удобных приложений и совершенно диспропорционально мало софта для дежавю файлов. Amazon Kindle и в версии для электронной книжки, и для компьютера и для айПада вообще дежавю не читает никак.

Есть ли вообще ридеры для электронных книг (как отдельное устройство), которые распознают файлы дежавю?
海賊王に俺はなる

Imp

Цитата: dragun97yu от июня 21, 2014, 14:56
Цитата: Imp от июня 21, 2014, 14:55
Цитата: Bhudh от июня 21, 2014, 14:53
Цитата: Imp от июня 21, 2014, 14:52их намного реже могут читать ридеры
Всмысле хардовые читалки? Электронные книжки?
Ибо для компа софт для них чаще всего раздельный.
Да да электронные читалки
Я могу с уверенностью сказать, что современные читалки будут поддерживать Djvu.
Я об отдельных устройствах для чтения электронных книг. Kindle точно не распознаёт и по-моему как минимум несколько других устройств тоже нет
海賊王に俺はなる

dragun97yu

Цитата: Imp от июня 21, 2014, 15:02
Цитата: dragun97yu от июня 21, 2014, 14:56
Цитата: Imp от июня 21, 2014, 14:55
Цитата: Bhudh от июня 21, 2014, 14:53
Цитата: Imp от июня 21, 2014, 14:52их намного реже могут читать ридеры
Всмысле хардовые читалки? Электронные книжки?
Ибо для компа софт для них чаще всего раздельный.
Да да электронные читалки
Я могу с уверенностью сказать, что современные читалки будут поддерживать Djvu.
Я об отдельных устройствах для чтения электронных книг. Kindle точно не распознаёт и по-моему как минимум несколько других устройств тоже нет
Вот вам и брендовая вещь :fp:
Я об устройствах и говорила :(
Скопка - это маленькая скопа.

Alexandra A

Так без платной программы Fine Reader не обойтись?

(Я никогда не приобретала через Интернет платные программы...)
taximagulus segouax caius iulius kent 25 august 55 before the common era
marcus tullius quintus tullius arpinum 6 may 51 before the common era

Bhudh

Цитата: Imp от июня 21, 2014, 15:01Есть ли вообще ридеры для электронных книг (как отдельное устройство), которые распознают файлы дежавю?
http://market.yandex.ru/search.xml?text=электронные книги +djvu
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Bhudh

Цитата: Alexandra A от июня 21, 2014, 15:10Так без платной программы Fine Reader не обойтись?
:fp: FineReader не единственная программа для OCR. Есть много бесплатных, например свободный движок Tesseract, который ещё и обучается.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

antic

Цитата: Alexandra A от июня 21, 2014, 15:10
Так без платной программы Fine Reader не обойтись?
Можно юзать фриварные распознавалки, но они, по определению, хуже.

По секрету, могу также сказать, что на каждую платную программу существует бесплатный кряк
— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

Alexandra A

Цитата: Bhudh от июня 21, 2014, 15:13
Цитата: Alexandra A от июня 21, 2014, 15:10Так без платной программы Fine Reader не обойтись?
:fp: FineReader не единственная программа для OCR. Есть много бесплатных, например свободный движок Tesseract, который ещё и обучается.
Какой именно установочный файл загрузить? У меня Windows 7.
taximagulus segouax caius iulius kent 25 august 55 before the common era
marcus tullius quintus tullius arpinum 6 may 51 before the common era

Imp

Цитата: Bhudh от июня 21, 2014, 15:11
Цитата: Imp от июня 21, 2014, 15:01Есть ли вообще ридеры для электронных книг (как отдельное устройство), которые распознают файлы дежавю?
http://market.yandex.ru/search.xml?text=электронные книги +djvu
То есть только продукция под брендом PocketBook
海賊王に俺はなる

Imp

Цитата: dragun97yu от июня 21, 2014, 15:05
Цитата: Imp от июня 21, 2014, 15:02
Цитата: dragun97yu от июня 21, 2014, 14:56
Цитата: Imp от июня 21, 2014, 14:55
Цитата: Bhudh от июня 21, 2014, 14:53
Цитата: Imp от июня 21, 2014, 14:52их намного реже могут читать ридеры
Всмысле хардовые читалки? Электронные книжки?
Ибо для компа софт для них чаще всего раздельный.
Да да электронные читалки
Я могу с уверенностью сказать, что современные читалки будут поддерживать Djvu.
Я об отдельных устройствах для чтения электронных книг. Kindle точно не распознаёт и по-моему как минимум несколько других устройств тоже нет
Вот вам и брендовая вещь :fp:
Ну устройства с привязкой к какой-то одной, пусть и разветвлённой компании, вообще всегда имеют усечённый функционал, но даже более независимые ридеры далеко не поголовно читают дежавю
海賊王に俺はなる

Oleg Grom

Цитата: dragun97yu от июня 21, 2014, 14:56
Я могу с уверенностью сказать, что современные читалки будут поддерживать Djvu.
Моя довольно древняя и примитивная читалка неплохо умеет djvu. Современные модели по идее должны читать. А покупать девачс который не понимает один из наболее распространенных форматов электронных книг, это извините, ссзб.

mnashe

Цитата: Oleg Grom от июня 21, 2014, 12:34
Цитата: antic от июня 21, 2014, 12:31Быстрее, это не сканировать отдельно по картинке, а сразу сканировать в режиме создания ПДФ.
И на выходе получать файлы огромного размера и дерьмового качества...
+100500

Цитата: antic от июня 21, 2014, 12:45
Цитата: Oleg Grom от июня 21, 2014, 12:34дерьмового качества
Вы считаете, что дежавюшное качество лучше пдфного? Я бы так не сказал.
При чём тут это?
Качество зависит от обработки, от выбора оптимального режима, а не от того, в каком формате сохранять.
Конечный формат определяет только размер файла: у djvu при равном качестве размер раза в полтора меньше.
Но это не имеет никакого отношения к обсуждаемому вопросу: дерьмовое качество по вашему методу получается из-за метода, а не из-за формата.

P.S.
Вот пример:
Цитата: mnashe от января  3, 2013, 18:33
Был у меня 900-страничный этимологический словарь Кляйна, переснятый фотоаппаратом и выложенный в виде 460-мегабайтного pdf.
Пользоваться этим монстром было очень неудобно: низкий контраст, неравномерное освещение, вьюер работал медленно из-за огромного размера.
Какой-то умник ужал его до 100 мегабайт и в таком виде выложил на UZT.
Скачал я, посмотрел на этот ужас и сразу стёр. Это вообще уже было нечитабельно, буквы порасплывались...
Какого было трогать файл, если лень посмотреть, что получилось?‥
Пришлось потратить около 40 часов в ScanTailor'е и привести книгу в божеский вид (djvu 62 MB).
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!


antic

Цитата: mnashe от июня 21, 2014, 21:57
дерьмовое качество
Факты в студию!
Лично я, например, видел гораздо больше дежавюшек хренового качества

Цитата: mnashe от июня 21, 2014, 21:57
переснятый фотоаппаратом и выложенный в виде 460-мегабайтного pdf.
Ну а в этом то случае чо на ПДФ грешить! Тут исходная информация хреново получена
— Боже мой, боже мой, чем вы вынуждены заниматься! Но я спрашиваю вас, кто-то все-таки летит ведь к звёздам! Где-то строят мезонные реакторы! Где-то создают новую педагогику! Боже мой, совсем недавно я понял, что мы даже не захолустье, мы — заповедник! В глазах всего мира мы — заповедник глупости, невежества и порнократии.
АБС «Хищные вещи века»

Иван-Царевич

Цитата: antic от июня 22, 2014, 01:22
Лично я, например, видел гораздо больше дежавюшек хренового качества
:+1:

Bhudh

Плюсадын оно может и плюсадын, только этих больше было больше чего? Больше пэдээфок-сканов или пэдээфок вообще? Большая часть пэфээфок изначально создаются как электронные документы, то есть это аналог doc, а не аналог djvu.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Skvodo

Цитата: Иван-Царевич от июня 22, 2014, 01:26
Цитата: antic от июня 22, 2014, 01:22
Лично я, например, видел гораздо больше дежавюшек хренового качества
:+1:
Так и есть.
Идея массово использовать djvu для книг возникла 10 лет назад, когда интернет-трафик и место на диске было в дефиците. Не совсем понятно, почему этот формат по инерции продолжает использоваться для электронных книг до сих пор.
Из-за сложных настроек формата, создание качественного djvu-файла требует большого опыта. Поэтому, например, на http://twirpx.com качественные djvu-книжки "собственного" производства выкладывают единицы пользователей.
Сохранять в djvu-файл что-то меньше 600 dpi с предварительной тщательной обработкой, например в ScanKromsator, означает потерю качества, вплоть до полной потери читаемости. PDF позволяет сохранять OCR-распознанный текст под изображением страницы, избавляя тем самым от вычитки. Это актуально для лингвистической и другой научной литературы с её сложной версткой, таблицами, формулами и тд.
Я забыл о djvu, после того, как мне стали попадаться книги, в которых абсолютно все кириллические "и" заменены на "н" или наоборот (такой вот алгоритм сжатия). Этого бы не произошло, если бы тот же текст был сохранён в PDF или JPEG. Возможности впоследствии создать удобочитаемую книжку из 300-мегабайтного pdf больше, чем пытаться "улучшать" из пережатого DJVU в 2мб.

PS:
Алгоритм "Создание электронных книг из сканов: как получить DjVu или PDF из бумажной книги":
http://rutracker.org/forum/viewtopic.php?t=2160930
http://rutracker.org/forum/viewtopic.php?t=2556964

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр