Допустим, вы загрузили несколько pdf-ов, по 50-100 Mb, которые делал кокой-то йети.
Там черно-белый документ сканирован в RGB, поставлено интеполированное разрешение 600 dpi (ну шоб побольшэ, этож понятно, шо чем больше разрешение, тем значиццо...), при этом все размыто и т.д. (Все это ужато редким архиватором, разумеется, желательно двумя, с УВЕЛИЧЕНИЕМ размера файла, запаролено и пароль утерян - ну ладно, эту часть опустим, ничем не ужато)
Вопрос: чем это все быстро и удобно переделать?, не ставя на комп гадкий акробат последней марки, потому что он не только тянет 800Mb, но и еще к тому же я не хочу ставить его из принципа (а это, как известно, достаточное основание).
Переснимать каждую страничку заново и переделать в DjVu.
Вот кстати, на счет DJVu -- видмо правильная мысля. А чем?
Если действительно очень надо — расшить файл и постранично превести в православный DjVu. Но это очень много мороки. Также можно найти другой pdf с лучшими параметрами. Другого способа не вижу.
Небинаризованные сканы в пдф - зло. djvu - наше все. Простейший вариант:
1. разобрать pdf
2. прогнать через scantailor
3.собрать в djvu
4. ???
5. Profit!
Цитата: Darkstar от декабря 1, 2011, 22:28
Там черно-белый документ сканирован в RGB, поставлено интеполированное разрешение 600 dpi
То что 600 dpi это правильно.
А вообще, достаньте одну страничку и запостите сюда. Посмотрим, что из этого можно сделать.
Чем доставать и разбирать?
Т.е. в djvu нельзя быстро и автоматически конвертировать?
"То что 600 dpi это правильно."
Да, очень удобно, если вы изучаете внутреннее строение атомов.
Цитата: Darkstar от Чем доставать и разбирать?
Нажать кнопку Print и распечатать одну страничку.
А есть какие-нибудь инструменты для конвертирования ПДФ во что-нибудь более анализабельное (например, в ХТМЛ с картиками)?
ABBYY PDF Transformer.
Но сие тоже не всякая машинка потянет.
Сгрузил какой-то бесплатный конвертер pdf>djvu-- он работает в час по чайной ложке и имеет очень мало настроек. (Но уменьшает очень классно все равно)
Кто-нибудь экспериментировал с получением djvu? Как он вообще по правилам-то делается?
если я имею сканы, то как лучше их в дежавю загнать?
Цитата: FA от января 21, 2013, 21:56
если я имею сканы, то как лучше их в дежавю загнать?
Экспрессэдитором.
DjVu Solo:
http://djvu.org/resources/
Может и сделать, и подредактировать djvu.
Если сканы не очень качественны (с нечёткими переходами между цветами, размыты), то зжимать надо как фото (если качество нужно сохранить). Если скан качественый и чисто черно-белый, тоже есть настройка в таком случае и тп. PDF на картинки можно разбить терминальной утилитой pdftoppm.
Могу добавить, из своего опыта.
Самое выгодное соотношение зжатие-качество в djvu получаем из качественного скана (DPI не менее 150, и если картинка сохраняется как jpg, то должна быть с очень малым коефициентом зжатия, во избежания силного «шума»). Сильно зжатые pdf или такие, которые сделаные из «размытых» картинок, в djvu переконвертировать обычно (без доп. сложной обработки) не выгодно изза получаемого выграша в соотношении качество-размер. Правда если в картинках только текст, то повозившись с некачественныеми картинками, можно целую книгу зжимать до нескольких мегабайтов, качество будет не очень, но читабельно.
Цитата: Дидо от февраля 13, 2013, 13:20PDF на картинки можно разбить терминальной утилитой pdftoppm.
Терминальной? Это, видать, если Фотошопа нет.
Да у меня и нет фотошопа, слишком дорогая штука... (для любителя и Гимп всемогущь). Тем более терминальные утилиты этакие операции делают на много быстрее.
Цитата: Lodur от февраля 13, 2013, 13:49
Цитата: Дидо от февраля 13, 2013, 13:20PDF на картинки можно разбить терминальной утилитой pdftoppm.
Терминальной? Это, видать, если Фотошопа нет.
А зачем графический интерфейс для разбивания PDF'а на картинки?! :o
Цитата: Demetrius от февраля 13, 2013, 13:59А зачем графический интерфейс для разбивания PDF'а на картинки?! :o
Не то, чтобы он нужен был. Просто не люблю, когда для каждого чиха своя отдельная терминальная утилита. Хотя не спорю, что некоторые из них весьма эффективны.
Цитата: Lodur от февраля 13, 2013, 14:06
Просто не люблю, когда для каждого чиха своя отдельная терминальная утилита.
Я Вас не понимаю. :???
Слушьте, а вы о чём пишете? А просто в Акробате Save as > Image > JPG нельзя сделать? ;D
Цитата: Wolliger Mensch от февраля 13, 2013, 14:14
Слушьте, а вы о чём пишете? А просто в Акробате Save as > Image > JPG нельзя сделать? ;D
Ну я виндой давно не пользуюсь. И чё? он так сохранит множество картинок-страниц? как то считал что так можно только одну...
Цитата: Demetrius от февраля 13, 2013, 14:12Я Вас не понимаю. :???
Фотошоп - универсальная программа. Которой я постоянно пользуюсь для всяких разных нужд. Он всё равно у меня стоит (и к моменту, когда мне понадобилось первый многостраничный PDF со сканом на странички разобрать, стоял уже несколько лет, как). Зачем же мне было искать какую-то терминальную утилиту, если в Фотошопе всё это делается тремя действиями, стоит только один раз автоматизацию настроить?
Цитата: Wolliger Mensch от февраля 13, 2013, 14:14Слушьте, а вы о чём пишете? А просто в Акробате Save as > Image > JPG нельзя сделать? ;D
У меня Акробат не стоит. Только Ридер. А что, умеет прямо пакетом 500 страниц в изображения сохранить?
Цитата: Дидо от февраля 13, 2013, 14:26
Ну я виндой давно не пользуюсь. И чё? он так сохранить множество картинок страниц? как то считал что так можно только одну...
Ничё. Блондинка за компьютером — святое дело. :yes:
Save as > Image сохраняет целую книгу в виде картинок заданного формата, названия файлов даются с автоматическим или заданным префиксом.
Цитата: Lodur от февраля 13, 2013, 14:29
Цитата: Wolliger Mensch от февраля 13, 2013, 14:14Слушьте, а вы о чём пишете? А просто в Акробате Save as > Image > JPG нельзя сделать? ;D
У меня Акробат не стоит. Только Ридер. А что, умеет прямо пакетом 500 страниц в изображения сохранить?
Да, Акробат сохраняет в картинках книгу целиком. Если нет Акробата — поставьте. По-моему, это ни одного раза не проблема. :yes:
По-моему поставить и использовать терминальную утилиту проще, чем Акробат. За фотошоп не знаю.
Терминальная утилита безплатная, в отличии от фотошопов и акробатов. Акробат ридер бесплатный не сохраняет в картинки, только что порверил.
Цитата: Demetrius от февраля 13, 2013, 14:34
По-моему поставить и использовать терминальную утилиту проще, чем Акробат. За фотошоп не знаю.
Вашей «терминальной» утилитой можно открывать, редактировать pdfы, добавлять заметки, формы, примечания и т. д.? А Акробатом можно. И Ридер уже не нужен будет.
Цитата: Wolliger Mensch от февраля 13, 2013, 14:36
Вашей «терминальной» утилитой можно открывать, редактировать pdfы, добавлять заметки, формы, примечания и т. д.?
А зачем? :??? А Вашим текстовым редактором можно читать почту?
Для всего вышеперечисленного есть другие программы.
Цитата: Wolliger Mensch от февраля 13, 2013, 14:30Если нет Акробата — поставьте. По-моему, это ни одного раза не проблема. :yes:
Не проблема, конечно. Но я уже к Фотошопу привык. В нём же и уровни пакетом выравниваю по заданному образцу, и т.д.
Цитата: Demetrius от февраля 13, 2013, 14:39
Для всего вышеперечисленного есть другие программы.
А зачем несколько программ, когда можно всё делать одной? :donno:
Цитата: Wolliger Mensch от февраля 13, 2013, 14:36
Цитата: Demetrius от февраля 13, 2013, 14:34
По-моему поставить и использовать терминальную утилиту проще, чем Акробат. За фотошоп не знаю.
Вашей «терминальной» утилитой можно открывать, редактировать pdfы, добавлять заметки, формы, примечания и т. д.? А Акробатом можно. И Ридер уже не нужен будет.
В линуксе есть безплатный pdfedit.
Цитата: Lodur от февраля 13, 2013, 14:39
Цитата: Wolliger Mensch от февраля 13, 2013, 14:30Если нет Акробата — поставьте. По-моему, это ни одного раза не проблема. :yes:
Не проблема, конечно. Но я уже к Фотошопу привык. В нём же и уровни пакетом выравниваю по заданному образцу, и т.д.
Ээ. Пардон. При чём Фотошоп? :what:
Цитата: Дидо от февраля 13, 2013, 14:40
В линуксе есть безплатный pdfedit.
Акробат тоже вполне себе бесплатен. :tss:
Цитата: Wolliger Mensch от февраля 13, 2013, 14:41
Цитата: Дидо от февраля 13, 2013, 14:40
В линуксе есть безплатный pdfedit.
Акробат тоже вполне себе бесплатен. :tss:
Я в эти игры уже не играю.
Безперспективно.
Зачем расшивать пдф на картинки фотожопой или какой-то специальной утилитой, если это можно сделать любым нормальным просмотрщиком графики?
Цитата: Дидо от февраля 13, 2013, 14:36
Терминальная утилита безплатная, в отличии от фотошопов и акробатов.
у нас пока все бесплатно. :)
Цитата: Wolliger Mensch от февраля 13, 2013, 14:40Ээ. Пардон. При чём Фотошоп? :what:
Тема тут о PDF-ках с криво сделанными сканами. Серыми (с невыровненными уровнями), с неправильным форматом графических файлов, и т.п. У меня несколько раз возникала нужда подобные файлы исправить. Я их разбирал на картинки, правил изображения и собирал обратно в Фотошопе. Не знаю, может Акробат всё это тоже умеет, но, как вы сами написали (и я на 100% согласен) : зачем ставить лишние программы, если всё можно сделать в одной?
Цитата: antic от февраля 13, 2013, 14:47
Зачем расшивать пдф на картинки фотожопой или какой-то специальной утилитой, если это можно сделать любым нормальным просмотрщиком графики?
Специальной утилитой можно управлять процессом разшивки.
Цитата: FA от февраля 13, 2013, 14:47
Цитата: Дидо от февраля 13, 2013, 14:36
Терминальная утилита безплатная, в отличии от фотошопов и акробатов.
у нас пока все бесплатно. :)
Да уж:
ЦитироватьPhotoshop CS6 Rus/Eng 65158285/65158261 Коробка 28512 руб.
Acrobat XI Pro Rus/Eng 65195260/65195259 Коробка 17108 руб.
Цитата: Lodur от февраля 13, 2013, 14:49
...зачем ставить лишние программы, если всё можно сделать в одной?
Когда не можешь себе позволить купить такую крутую и очень дорогую програму, или не хочешь. Вон тогда и выкручиваешся как можешь...
Цитата: antic от февраля 13, 2013, 14:47Зачем расшивать пдф на картинки фотожопой или какой-то специальной утилитой, если это можно сделать любым нормальным просмотрщиком графики?
А какие, по вашему мнению, нормальные?
Цитата: Дидо от февраля 13, 2013, 14:50
Photoshop CS6 Rus/Eng 65158285/65158261 Коробка 28512 руб.
Acrobat XI Pro Rus/Eng 65195260/65195259 Коробка 17108 руб.
а на торрентах их нет?
Цитата: Lodur от февраля 13, 2013, 14:49
Цитата: Wolliger Mensch от февраля 13, 2013, 14:40Ээ. Пардон. При чём Фотошоп? :what:
Тема тут о PDF-ках с криво сделанными сканами. Серыми (с невыровненными уровнями), с неправильным форматом графических файлов, и т.п. У меня несколько раз возникала нужда подобные файлы исправить. Я их разбирал на картинки, правил изображения и собирал обратно в Фотошопе. Не знаю, может Акробат всё это тоже умеет, но, как вы сами написали (и я на 100% согласен) : зачем ставить лишние программы, если всё можно сделать в одной?
Акробат, конечно, не для того, чтобы картинки редактировать. Я говорил про то, что из Акробата можно любую сканированную книгу сохранить как набор картинок.
Цитата: Wolliger Mensch от февраля 13, 2013, 14:40
А зачем несколько программ, когда можно всё делать одной?
На самом деле - для того, чтобы не делать по сто махов мышью на каждый чих. И чтобы не запускать тяжеловесную программу опять же на каждый чих. Даже если во многих универсальных программах есть какая-то "автоматизация", для каждой из них это надо учить по отдельности. А интерпретатор командной строки один на всех.
Интерактивные программы удобнее только в случаях, когда для выполняемых операций жизненно необходим визуальный контроль. Т.е. если с каждой страницей/картинкой подразумевается индивидуальная работа. А для массовых строго единообразных операций-то зачем?
Цитата: FA от февраля 13, 2013, 15:06
Цитата: Дидо от февраля 13, 2013, 14:50
Photoshop CS6 Rus/Eng 65158285/65158261 Коробка 28512 руб.
Acrobat XI Pro Rus/Eng 65195260/65195259 Коробка 17108 руб.
а на торрентах их нет?
А зачем воровать, когда есть бесплатно и не хуже аналоги?
Пользоватся пиратной продукцией бесперспективно (лучше купить продукцию у тех, кто предлагает её за нормальную цену, или пользоватся бесплатными програмами с открытым кодом). Неподдерживайте монополистов!
Если будете продолжать в таком же духе, вам рано или поздно придётся каким то образом заплатить за эти програмы, прямиком или через «зад».
Цитата: Toman от февраля 13, 2013, 16:42Даже если во многих универсальных программах есть какая-то "автоматизация", для каждой из них это надо учить по отдельности. А интерпретатор командной строки один на всех.
Ага, а ключи командной строки, типа, тоже одни на всех? Уж на что, например, eac3to мощная и умеющая то, что аналоги с графическим интерфейсом не умеют, прога - но пока не промедитировал полдня над инструкцией, так и не научился к ней правильно нужные параметры писать.
Цитата: Lodur от февраля 13, 2013, 14:56
А какие, по вашему мнению, нормальные?
Ну, например Irfanview, XNview и другие полнофункциональные программы для просмотра графических файлов. Ими же можно делать и пакетную обработку расшитых сканов
Цитата: antic от февраля 13, 2013, 21:07Ну, например Irfanview, XNview и другие полнофункциональные программы для просмотра графических файлов. Ими же можно делать и пакетную обработку расшитых сканов
Спасибо, учту. Я, по старинке, пользуюсь ACDSee (и, скорее всего, версией не из свежих). Он такого не умеет. И встроенный редактор очень уж неуклюж (по сравнению с Фотошопом). Хотя для чего-то простого (не создания коллажей и прочей лабуды, на которую способен Фш) вполне сгодится.
если речь идет только об уменьшении размера файла, но не об улучшении качества изображения, то я в этом случае давно пользуюсь виртуальным pdf принтером. Разных вариантов подобного типа программ полно в Сети. Например: bullzip, dopdf. это для MS. думаю и для linux-ов подобные проги имеются. смысл у них в том, что после инсталляции в системе появляется еще один принтер, на который на печать выдается нужный документ (Причём любой текстовый, графический...). На выходе получаем pdf-файл с разрешением и форматом, установлеными в настройках. Некоторые такие принтеры позволяют получать не только pdf, но и многостаничный tiff, djvu.