Бесит популярность формата PDF для электронных публикаций.
Зачем нужна эта компьютерная имитация недостатков бумаги?
.txt for ever
Цитата: Hellerick от августа 6, 2011, 06:30
Зачем нужна эта компьютерная имитация недостатков бумаги?
капитализм ?
А там есть примитивный способ защиты от копирования документа и цитирования. Правда, тогда непонятно, почему многие юзают PDF без защиты.
Цитата: Hellerick от августа 6, 2011, 06:30
Бесит популярность формата PDF для электронных публикаций.
Зачем нужна эта компьютерная имитация недостатков бумаги?
Лучше обычный .html формат. Причём чтобы весь текст на одной, ну или нескольких страницах (немногих).
Копируешь с помощью Ctrl+C Ctrl+V в пограмму Microsoft Word, редактируешь текст (чтобы было меньше страниц) и распечатываешь...
.pdf распечатывать - слишком много бумаги. Вот это бесит!
Всё что мне интересно - всё печатаю на бумагу.
Цитата: Alexandra A от Причём чтобы весь текст на одной, ну или нескольких страницах (немногих).
Пробовал я открывать xmlʼки из docx... Тихий ужас на 30 мегабайт представляете?
Цитата: Hellerick от августа 6, 2011, 06:30
Бесит популярность формата PDF для электронных публикаций.
Зачем нужна эта компьютерная имитация недостатков бумаги?
А мне как раз только PDF и нравится. Предпочитаю его всем остальным.
Бесят две вещи: когда книги запихивают в формат .docx и популяризация формата DejaVu.
Цитата: Bhudh от августа 6, 2011, 08:13
Цитата: Alexandra A от Причём чтобы весь текст на одной, ну или нескольких страницах (немногих).
Пробовал я открывать xmlʼки из docx... Тихий ужас на 30 мегабайт представляете?
Я не совсем понимаю что это такое...
Меня не волнует размер файла. На компьютере ведь много места, 300 GB жёсткий диск.
Мне главное чтобы быстрее распечатать текст, при редактировании тратить как можно меньше времени, и чтобы меньше бумаги при распечатывании.
Кода на бумаге есть - я спокойна.
Цитата: Alexandra A от Меня не волнует размер файла.
Плэıн-текст в 30 метров открывается куда муторнее, чем спецформат в те же 30 метров.
Цитата: basta от августа 6, 2011, 07:34
.txt for ever
Ну... В принципе, да.
Идеальным форматом для хранения и передачи текста я считаю TXT с вики-разметкой. Он наиболее гибок — его проще всего превратить во что-угодно.
Цитата: Bhudh от августа 6, 2011, 08:13
Пробовал я открывать xmlʼки из docx... Тихий ужас на 30 мегабайт представляете?
А зачем это делать?
И не надо путать людей, в плане величины файла docx — весьма экономичный формат.
Цитата: Hellerick от в плане величины файла docx — весьма экономичный формат.
Ещё бы — txt в zipʼе!
Но выглядит хорошо, только когда Вордом открывается...
Хотя, спрашивается, зачем для XMLʼя такая дура, как Ворд?‥
Цитата: Bhudh от августа 6, 2011, 08:54
Ещё бы — txt в zipʼе!
По моему это наиболее кошерно — сочетание компактности с человекочитаемостью.
Хотя, конечно, читая собственно код, убеждаешься в его дебилизме. Восемь раз в одном абзаце указывать, что он написан на американском английском это как бы не совсем хорошо.
Цитата: Alexandra A от августа 6, 2011, 08:35
Кода на бумаге есть - я спокойна.
Бумага не нужна.
Цитата: Bhudh от августа 6, 2011, 08:54
зачем для XMLʼя такая дура, как Ворд?‥
Какая странная постановка вопроса.
Цитата: Dana от августа 6, 2011, 08:15
А мне как раз только PDF и нравится. Предпочитаю его всем остальным.
Бесят две вещи: когда книги запихивают в формат .docx и популяризация формата DejaVu.
Pdf и Djvu рулят. У каждого своё применение.
Бесит "Йцукен"-раскладка. Уже привык к фонетической на клавиатуре без русских букв, а тут реанимировал свой старый десктоп с русской клавиатурой.
Цитата: sasza от августа 6, 2011, 09:08
Бесит "Йцукен"-раскладка. Уже привык к фонетической на клавиатуре без русских букв, а тут реанимировал свой старый десктоп с русской клавиатурой.
У меня Йцукен и клавиатура без русских букв, проблем не возникает.
Цитата: Hellerick от Хотя, конечно, читая собственно код, убеждаешься в его дебилизме. Восемь раз в одном абзаце указывать, что он написан на американском английском это как бы не совсем хорошо.
Когда я вижу сайты, сверстанные в Ворде, мне хочется вырезать и выкинуть из кода процентов 95.
Цитата: Hellerick от Какая странная постановка вопроса.
То есть Вы согласны, что парсер XML должен занимать полгига? :umnik:
Цитата: Bhudh от августа 6, 2011, 09:33
Цитата: Hellerick от Какая странная постановка вопроса.
То есть Вы согласны, что парсер XML должен занимать полгига? :umnik:
Не понимаю об чем вы.
Цитата: Hellerick от августа 6, 2011, 06:30
Бесит популярность формата PDF для электронных публикаций.
Зачем нужна эта компьютерная имитация недостатков бумаги?
Затем, чтобы документ выглядел у всех так, как ты задумал и как он выглядит у тебя. Никакой другой формат пока что этого не умеет.
Бесит не формат, а человек, его выбирающий :)
Зачем сохранять в DjVu и терять качество, если лучше сохранить в отменном виде, но в pdf?
Для разных целей и разной информации ИМХО люди выбирают подходящий формат.
Цитата: Kern_Nata от августа 6, 2011, 10:26
Зачем сохранять в DjVu и терять качество, если лучше сохранить в отменном виде, но в pdf?
Зачем сохранять в JPG и терять качество, если можно в BMP в отменном виде? Затем, чтобы снизить на несколько порядков размер файла.
Если речь идет о ПДФ с электронным текстом, то конечно выбирать ДжВу неразумно. Но речь раньше шла вроде о том, зачем вообще ПДФ нужен.
Цитата: Kern_Nata от августа 6, 2011, 10:26
Для разных целей и разной информации ИМХО люди выбирают подходящий формат.
Совершенно верно, поэтому иногда ДеЖавю формат более подходящий.
Цитата: RawonaM от Никакой другой формат пока что этого не умеет.
Умеет. JPEG. :smoke:
Цитата: Bhudh от августа 6, 2011, 10:35
Цитата: RawonaM от Никакой другой формат пока что этого не умеет.
Умеет. JPEG. :smoke:
Надеюсь, все оценили шутку.
Сообщений:
777Это было красиво, да... :)
Цитата: Bhudh от августа 6, 2011, 10:35
JPEG
доооооооооо! прогрессивный и шибкосжатый :)
Цитата: Bhudh от августа 6, 2011, 10:35
Цитата: RawonaM от Никакой другой формат пока что этого не умеет.
Умеет. JPEG. :smoke:
JPEG не бывает многостраничным.
Цитата: Dana от августа 6, 2011, 08:15
Бесят две вещи: когда книги запихивают в формат .docx и популяризация формата DejaVu.
Чем вас не устраивает стандартный, открытый формат DjVu, вьювер которого работает в разы быстрее PDFовского при сжатии в разы сильнее?
Цитата: RawonaM от августа 6, 2011, 10:03
Затем, чтобы документ выглядел у всех так, как ты задумал и как он выглядит у тебя. Никакой другой формат пока что этого не умеет.
PDF это как раз и не умеет. Шрифты с крокозябрами и налезающие буквы какбэ намекают.
Цитата: Alone Coder от Шрифты с крокозябрами и налезающие буквы какбэ намекают.
Это вина не формата, а самих махеров и невстроения фонтов.
Цитата: Alone Coder от августа 6, 2011, 16:49
Чем вас не устраивает стандартный, открытый формат DjVu, вьювер которого работает в разы быстрее PDFовского при сжатии в разы сильнее?
А мне не нравится, как отображаются документы в нём.
Цитата: Alone Coder от августа 6, 2011, 16:51
PDF это как раз и не умеет. Шрифты с крокозябрами и налезающие буквы какбэ намекают.
Шрифты встраивать нужно.
Цитата: Bhudh от августа 6, 2011, 09:33
Когда я вижу сайты, сверстанные в Ворде, мне хочется вырезать и выкинуть из кода процентов 95.
Кстати, аналогично :UU: Одно время прямо навязчивая идея была :)
Цитата: Hellerick от августа 6, 2011, 06:30
Бесит популярность формата PDF для электронных публикаций.
Зачем нужна эта компьютерная имитация недостатков бумаги?
Пережитки эпохи, когда принтер еще был актуальным девайсом.
Какие недостатки-то?
Цитата: Dana от августа 6, 2011, 17:43
А мне не нравится, как отображаются документы в нём.
Я всегда думал, что это формат большей частью для сканированных книг. Не понимаю людей, если они используют его для другого.
У меня есть несколько книг в DJVU, почти все читаются на ура. У некоторых просто недостаточное качество сканирования.
Цитата: Bhudh от августа 6, 2011, 09:33
Когда я вижу сайты, сверстанные в Ворде, мне хочется вырезать и выкинуть из кода процентов 95.
Я всегда думал, что Ага. По крайней мере, версии 2000–2003 дают ужасный код, а другие не проверял, но следует ожидать... Не понимаю людей, если они используют Word в качестве html-редактора.
Цитата: Alexandra A от августа 6, 2011, 08:35
Меня не волнует размер файла. На компьютере ведь много места, 300 GB жёсткий диск.
Только вы такие тексты не рассылайте знакомым.
Цитата: Hellerick от августа 6, 2011, 08:50
Идеальным форматом для хранения и передачи текста я считаю TXT с вики-разметкой. Он наиболее гибок — его проще всего превратить во что-угодно.
:+1:
Цитата: RawonaM от августа 6, 2011, 10:03
Затем, чтобы документ выглядел у всех так, как ты задумал и как он выглядит у тебя. Никакой другой формат пока что этого не умеет.
А зачем это нужно в статье, выложенной в сети? В html нужно выкладывать — ну а каждый как захочет, так и распечатает, если потребуется.
Цитата: Triton от августа 6, 2011, 19:13
Цитата: RawonaM от августа 6, 2011, 10:03Затем, чтобы документ выглядел у всех так, как ты задумал и как он выглядит у тебя. Никакой другой формат пока что этого не умеет.
А зачем это нужно в статье, выложенной в сети?
Вопросы зачем нужен формат и зачем его неправильно применяют — это разные и несвязанные вопросы.
Цитата: Triton от августа 6, 2011, 19:13
А зачем это нужно в статье, выложенной в сети? В html нужно выкладывать — ну а каждый как захочет, так и распечатает, если потребуется.
Попробуйте статью по физике в html выложить, ага. С кучей формул.
Цитата: Dana от августа 6, 2011, 19:15
Попробуйте статью по физике в html выложить, ага. С кучей формул.
XHTML 5 уже поддерживает.
Только каждый браузер все равно что хочет то и делает.
Кстати касательно распечатки хтмл: сноски и ссылки типа «см. страницу 25» потеряют смысл. Так что ПДФу еще жить, пока не появятся годные замены.
Цитата: Dana от августа 6, 2011, 19:15
Цитата: Triton от августа 6, 2011, 19:13
А зачем это нужно в статье, выложенной в сети? В html нужно выкладывать — ну а каждый как захочет, так и распечатает, если потребуется.
Попробуйте статью по физике в html выложить, ага. С кучей формул.
А в вики — запросто.
Кстати, благодаря наличию сервисов типа latex.codecogs.com формулы и в html перестают быть заметной проблемой.
Цитата: Hellerick от августа 6, 2011, 19:20
Кстати, благодаря наличию сервисов типа latex.codecogs.com формулы и в html перестают быть заметной проблемой.
Они и без него уже не проблема. Вот хочу чтоб на лф вместо кодекогса был нативный хтмл, но некогда этим заниматься.
Цитата: Dana от августа 6, 2011, 19:15
Цитата: Triton от августа 6, 2011, 19:13
А зачем это нужно в статье, выложенной в сети? В html нужно выкладывать — ну а каждый как захочет, так и распечатает, если потребуется.
Попробуйте статью по физике в html выложить, ага. С кучей формул.
Это ещё фигня.
Работы по славянской акцентуации или по эвенкийскому в формате doc нести с компьютера с семёркой на компьютер с ХР, чтобы распечатать — это номер.
Ещё одно дополнение.
Не так давно, в пору, когда у меня сломался принтер, потребовалось мне распечатать текст с греческой политоникой. Подумав, что ничего особо экзотического там нет, не стала конвертировать .docx в PDF (хотя обычно так делаю). Распечатала в копи-центре. И что бы вы думали? На месте греческих букв с диакритиками стояли квадратики!
Цитата: Alexandra A от августа 6, 2011, 08:11
Лучше обычный .html формат. Причём чтобы весь текст на одной, ну или нескольких страницах (немногих).
+1
Цитата: Alexandra A от августа 6, 2011, 08:11
Копируешь с помощью Ctrl+C Ctrl+V в пограмму Microsoft Word, редактируешь текст (чтобы было меньше страниц) и распечатываешь...
−1
Цитата: Dana от августа 6, 2011, 08:15
Бесят две вещи: когда книги запихивают в формат .docx
+1
Цитата: Dana от августа 6, 2011, 08:15
и популяризация формата DejaVu.
−1
Цитата: ginkgo от августа 6, 2011, 18:51
Цитата: Bhudh от августа 6, 2011, 09:33
Когда я вижу сайты, сверстанные в Ворде, мне хочется вырезать и выкинуть из кода процентов 95.
Кстати, аналогично :UU: Одно время прямо навязчивая идея была :)
У меня это зашло ещё дальше: я много раз проделывал эту процедуру.
Более того, я даже написал две программы, поддерживающие простенькие скрипты (в каждой — свой), существенно ускоряющие эту работу. Одна делает замены в любом файле, другая специально ориентирована на обработку HTML-тегов.
И всё равно удаление MS-мусора нередко занимает кучу времени (но это от вёрстки зависит — при хорошей вёрстке времени уходит намного меньше, чем при хаотической).
Цитата: Dana от августа 6, 2011, 09:15
У меня Йцукен и клавиатура без русских букв, проблем не возникает.
:+1:
А дома есть и самодельная фонетическая — для жены.
Цитата: Alone Coder от августа 6, 2011, 16:49
Чем вас не устраивает стандартный, открытый формат DjVu, вьювер которого работает в разы быстрее PDFовского при сжатии в разы сильнее?
:+1:
Цитата: RawonaM от августа 6, 2011, 10:34
Если речь идет о ПДФ с электронным текстом, то конечно выбирать ДжВу неразумно.
Однако djvu тоже поддерживает формат с электронным текстом. Я не заметил у него ни недостатков, ни преимуществ по сравнению с аналогичным pdf.
Цитата: RawonaM от августа 6, 2011, 10:34
Совершенно верно, поэтому иногда ДеЖавю формат более подходящий.
Ярче всего преимущество djvu на больших чёрно-белых растровых файлах: большой выигрыш в скорости и размере.
А djvu-photo при равном качестве занимает примерно столько же места, как аналогичный pdf.
Цитата: mnashe от августа 7, 2011, 09:54
Цитата: RawonaM от августа 6, 2011, 10:34Если речь идет о ПДФ с электронным текстом, то конечно выбирать ДжВу неразумно.
Однако djvu тоже поддерживает формат с электронным текстом. Я не заметил у него ни недостатков, ни преимуществ по сравнению с аналогичным pdf.
Я не в курсе, но по-моему ДжВю очень ограничен. Кроме того, ограничена его поддержка. PDF прочитают все, ДжВю — избранные.
Я вообще не видел джвю текстовых, только картиночные. Можно мне показать пример текстового ДжВю?
Конечно, в тех областях, где pdf не уступает djvu, лучше обходиться им.
Правда, есть ещё фактор медлительности вьюера (даже foxit).
Цитата: RawonaM от августа 7, 2011, 10:05
Я вообще не видел джвю текстовых, только картиночные. Можно мне показать пример текстового ДжВю?
Поищу дома, если не забуду.
Или на инфанате.
(wiki/en) DjVu (http://en.wikipedia.org/wiki/DjVu)
Ничего про его полную альтернативу ПДФ не написано, только для сканированных документов.
Текстовый djvu — т.е., хранящий текст в виде последовательности символьных кодов? Основное предназначение djvu — сканы книг. Все остальное выглядит как попытка превратить его в нечто универсальное (но тогда зачем djvu, если уже есть pdf?)
ЦитироватьЛучше обычный .html формат. Причём чтобы весь текст на одной, ну или нескольких страницах (немногих).
ІМНО, pdf удобнее, как минимум, возможностью нормально организовать навигацию по документу. Правильный pdf с закладками разделов на боковой панели намного удобнее, чем длинное html-полотно с содержанием где-то в самом начале. Конечно, можно имитировать pdf-овскую панель закладок, использовав фреймы, но это уже получится три файла вместо одного (фреймсет, содержание, сам документ), и редко кто так делает. Удобно, если весь документ в одном файле, а не текст отдельно, иллюстрации отдельно. Удобно, если есть возможность легко добавить или исправить содержание (механизм закладок в pdf для этого идеален — их можно редактировать непосредственно в фоксите; html в этом отношении менее удобен). И да, отсутствие нумерации страниц в длинном html — тоже минус.
Основной минус pdf — то, что он бинарный, из чего следует сложность создания, редактирования, автоматической обработки данных из него. Но это скорее неудобства для программиста, чем для пользователя.
p.s. Еще следует вспомнить о нестандартных шрифтах, которые в pdf встраиваются без проблем, а в html подгружаются непонятно-как, во всех браузерах подгружаются по-разному, а в некоторых не подгружаются вообще.
Цитата: Python от августа 7, 2011, 10:52
Текстовый djvu — т.е., хранящий текст в виде последовательности символьных кодов? Основное предназначение djvu — сканы книг. Все остальное выглядит как попытка превратить его в нечто универсальное (но тогда зачем djvu, если уже есть pdf?)
+1
Цитата: Python от августа 7, 2011, 10:52
Основное предназначение djvu — сканы книг
Чаще всего - "черных" сканов или в градациях серого. Цветные книги да еще и с качественными иллюстрациями - это pdf.
Кстати, я так и не умею до сих пор текстовый слой вставлять в DjVu :(
Цитата: Python от августа 7, 2011, 10:52
Основной минус pdf — то, что он бинарный, из чего следует сложность создания, редактирования, автоматической обработки данных из него. Но это скорее неудобства для программиста, чем для пользователя.
Основной минус PDF — в ненастраиваемости.
Какой бы идеальной не была верста PDF-документа, для большинства пользователей (как «бумажных» так и «экранных») она окажется хуже, чем могла бы быть.
У всех разные технические условия работы с документом, и каждому необходимо дать возможность подстроить под них документ.
Цитата: Hellerick от августа 7, 2011, 15:17
верста PDF-документа окажется хуже, чем могла бы быть.
Как-то туманно, как-то непонятно:(
А это что:
возможность подстроить документ под технические условия?
Цитата: Kern_Nata от августа 7, 2011, 17:23
Цитата: Hellerick от августа 7, 2011, 15:17
верста PDF-документа окажется хуже, чем могла бы быть.
Как-то туманно, как-то непонятно:(
А это что: возможность подстроить документ под технические условия?
Изменить размер шрифта, сменить гарнитуру, разбить на две колонки, сменить цветовую схему и т.п.
То, что хорошо на моем ноутбуке, будет по-идиотски смотреться на моем HD мониторе, десу же.
Текст — он и в Африке текст :)
Простая последовательность восьмибитных (как правило) кодов, каждый из которых соответствует либо символу, либо управляющему коду.
Отличается лишь кодировкой и способом перевода строки.
ПолиграфичностьНизкая. Набор средств разметки у текста весьма невелик. Форматирование абзацев, отступы и выделение заглавными буквами — вот, пожалуй, и все.
МасштабируемостьВсе зависит, от того, как сформатирован текст. Если он аккуратно отформатирован по абзацам с выравниванием, то очень низкая. Если же разбиения на строки нет — «один абзац — одна строка» — тогда высокая.
КроссплатформенностьПрактически абсолютная.
КонвертируемостьПрактически абсолютная.
ГипертекстНет.
Возможность редактированияАбсолютная.
ЦитироватьФормат txt активно использовался при создании всевозможных сборников книг («Библиотека в кармане», «HarryFan Text Collection» и пр.). Сейчас книги в формате txt можно найти, пожалуй, лишь в библиотеке Максима Мошкова (да и то перед подачей их пользователю они преобразуются в HTML) и в некоторых небольших библиотеках.
Этот формат был специально разработан компанией Microsoft в 1987 году для переноса текста с разметкой из одной программы в другую. В таком качестве он используется и по сей день. RTF понимают практически все современные текстовые редакторы.
ПолиграфичностьВыше среднего.
МасштабируемостьПочти абсолютная.
КроссплатформенностьОчень высокая.
КонвертируемостьОчень высокая.
ГипертекстНет.
Возможность редактированияАбсолютная.
ЦитироватьRTF до сих пор широко используется в онлайн-библиотеках. Главным образом, именно из-за его хорошей совместимости с различным программным обеспечением.
ЦитироватьФормат DOC — это внутренний формат Microsoft Word и предназначен для хранения текстовых документов, подготовленных в этой программе. Распространенность Microsoft Office и Microsoft Word как его части обусловила распространенность формата DOC.
ПолиграфичностьВысокая.
МасштабируемостьВысокая.
КроссплатформенностьНиже среднего.
КонвертируемостьВысокая.
ГипертекстПрисутствует.
Возможность редактированияАбсолютная.
ЦитироватьИМХО документы Word используют в качестве e-book по одной причине: авторам книги (или сканеристам;))) просто лень конвертировать его в более удобочитаемый формат.
ЦитироватьЯзык HTML (HyperText Markup Language) используется для отображения информации в сети Интернет.
ПолиграфичностьВысокая.
МасштабируемостьОчень высокая.
КроссплатформенностьПрактически абсолютная.
КонвертируемостьПрактически абсолютная.
ГипертекстЕсть!
Возможность редактированияАбсолютная.
ЦитироватьХотя НTML позволяет неплохо оформить текстовый документ, он все же не слишком подходит для e-book. Далеко не всем нравится читать книги в браузере. При использовании же программы-ридера HTML конвертируется в обычный текст и теряет все свои преимущества. А вот формат CHM, первоначально предназначавшийся для подготовки файлов справки к программному обеспечению, — дело иное. Компактность и высокая интерактивность делают его весьма удобным для различных электронных руководств и справочников.
ЦитироватьУ всех вышеперечисленных форматов есть один существенный недостаток — они ИЗНАЧАЛЬНО НЕ ПРЕДНАЗНАЧАЛИСЬ для создания электронных книг. Созданные на их основе файлы даже не являются книгами — это просто текстовые документы. Но, как ни странно, из этого же недостатка вытекает и достоинство: чтобы читать их, не требуется специального программного обеспечения. Достаточно стандартных средств, встроенных в операционную систему. Форматы, описанные далее, уже требуют установки специальных программ для их просмотра.
ЦитироватьПервоначально этот формат разрабатывался для нужд полиграфии — в основном для платформонезависимого переноса макетов. В последние годы интенсивно продвигается как формат для создания e-book.
ПолиграфичностьАбсолютная. Для того и был разработан. Как следствие .PDF-файлы могут быть весьма увесистыми.
МасштабируемостьНизкая! На портативных устройствах читать достаточно проблематично.
КроссплатформенностьНиже среднего.
ГипертекстЕсть.
Возможность редактированияНизкая. К тому же, для этого нужно устанавливать громоздкий Adobe Acrobat.
ЦитироватьОсновной аргумент против применения PDF для изготовления e-book — большой объем файла и неудобство чтения на портативных устройствах. Говоря о PDF, нельзя не упомянуть и аналогичные форматы. Например, формат Zinio, который, в отличие от PDF, предназначен специально для выпуска в электронном виде периодических изданий — в частности, глянцевых журналов.
ЦитироватьФормат DJVU был создан компанией АТ&T специально для компактного представления информации в Internet. Формально файлы, созданные с его использованием, трудно назвать книгой. Это, по существу, растровый многостраничный графический файл. При его создании специальные алгоритмы отделяют текст от фона и иллюстраций, после чего они сжимаются с различным разрешением, что и обеспечивает чрезвычайно высокое сжатие картинки (примерно 1:500) при приемлемом качестве изображения. Эти свойства делают его идеальным для множества сканированных компьютерных (и не только) руководств, которыми сейчас завалены варезные сайты (такие книги еще называют «освобожденными»;))). Ведь если книга содержит примеры исходников программ, формулы, схемы или сложные таблицы, то даже незначительные ошибки при OCR могут непоправимо испортить ее. A DJVU позволяет представить книгу «как есть».
ПолиграфичностьВысокая.
МасштабируемостьСредняя. Зависит от того, насколько хорошо программа-просмотрщик поддерживает anti-aliasing.
КроссплатформенностьСредняя.
КонвертируемостьНиже среднего.
ГипертекстЧто-то вроде того
Возможность редактированияСредняя.
Всех иных, конечно, лучше формат
FictionBook 2Формат FictionBook был разработан Дмитрием Грибовым с несколькими соавторами при поддержке группы энтузиастов. Он полностью базируется на XML. На данный момент это самый прогрессивный и перспективный формат для электронных книг.
Единственный его недостаток, как признают сами авторы, — бОльшие временные затраты при подготовке начального текста. Впрочем, он легко окупается удобством чтения. В отличие от всех не-XML- форматов, которые ориентированы на оформление текстовых данных, в FictionBook упор сделан на структурирование документа. То есть с помощью тегов выделяются области текста: это — глава, это — заголовок, это — эпиграф, а вот это — цитата. А как все это будет выглядеть на экране, зависит от программы-ридера. На случай, если потребуется оформить книгу строго определенным образом, предусмотрена возможность присоединения таблицы стилей.
В формате FictionBook можно создать четко структурированную книгу (именно книгу, а не просто электронный документ), которую удобно читать в специализированной программе-читалке, а в случае надобности можно легко сконвертировать в любой популярный формат. Как правило, без потери разметки. Возможности FictionBook позволяют выделить заголовки, эпиграфы, стихи, цитаты, вставить в текст иллюстрации и сноски и, что немаловажно, внести все выходные данные книги.
Все компоненты книги (описание, непосредственно текст, иллюстрации) хранятся в одном файле, который можно упаковать архиватором. Большинство программ-читалок для FB2 умеют напрямую работать с архивами. За прошедшие несколько лет стандарт уже успел устояться. Несмотря на то, что он включает сравнительно немного элементов, в него трудно добавить что-то действительно новое и полезное.
Еще одно достоинство FictionBook — книги в этом формате отлично поддаются каталогизации. Опираясь на встроенную систему описания книги, можно с легкостью создать как домашнюю, так и сетевую электронную библиотеку любого масштаба. Учитывая объем электронных книг, накопленный до появления FictionBook, первый вопрос, который возникает при знакомстве с новым форматом, — это возможность конвертирования книг из других форматов.
Разработанные авторами формата и энтузиастами программные средства позволяют эффективно конвертировать книги из форматов txt, HTML, RTF (doc). Если же, наоборот, возникнет необходимость преобразовать книгу в формате FictionBook в другой формат, то «штатный» конвертер FB2Any неплохо справляется с преобразованием FB2 не только в классические txt и RTF, но и в специализированные форматы Roсket Book, iSilo, Microsoft Reader.
Таким образом, формат FictionBook обладает всеми качествами, чтобы стать единым стандартом для e-book. И фактически уже стал им. Использование этого формата в русскоязычных онлайн-библиотеках подтвердило его функциональность и жизнеспособность. В нынешнем состоянии формат наиболее подходит для художественной литературы. Что совершенно не мешает использовать его для технических, методических, справочных изданий, а также для периодики.
Kern_Nata, спасибо, всё кратко и толково.
Цитата: RawonaM от августа 7, 2011, 10:05
Я вообще не видел джвю текстовых, только картиночные. Можно мне показать пример текстового ДжВю?
Пока что попался один djvu файл, полученный из doc, и он оказался растровым :(
Может, я просто раньше невнимательно смотрел?
Буду проверять по мере натыкания.
Цитата: mnashe от августа 7, 2011, 19:48
Пока что попался один djvu файл, полученный из doc
А это как? Что за конвертор???
Цитата: Kern_Nata от августа 7, 2011, 19:50
Цитата: mnashe от августа 7, 2011, 19:48
Пока что попался один djvu файл, полученный из doc
А это как? Что за конвертор???
Не знаю, не моё.
Просто качаю с инфанаты.
DEE имеет модуть окаэривания, то только инглиша;.. а "вжигание" текстового слоя в него идет через ФР
Чтоб из Ворда - ... впервые слышу!
У меня был какой-то DjVu-файл с текстом. Не помню, где он. Помню только, что при копировании слов с переносами типа «пере-//нос» получалось примерно или точно такое: «пере-перенос». Не знаю, недостатки ли это лично её текстового слоя, читалки или формата.
Цитата: arseniiv от августа 7, 2011, 20:56
У меня был какой-то DjVu-файл с текстом.
Разыскивается не с текстом, а из текста.
Цитата: RawonaM от августа 7, 2011, 21:21
а из текста.
таких нет :)
текстовых слой накладывается на графику
DjV'ями из текста не торгую. У меня по этой части PDF несколько.
Цитата: mnashe от У меня это зашло ещё дальше: я много раз проделывал эту процедуру.
Да я тоже несколько раз.
До скриптов дело не дошло — регулярки ленно учить.
Цитата: arseniiv от У меня был какой-то DjVu-файл с текстом. Не помню, где он. Помню только, что при копировании слов с переносами типа «пере-//нос» получалось примерно или точно такое: «пере-перенос». Не знаю, недостатки ли это лично её текстового слоя, читалки или формата.
Пара книжек отсюда (http://wiki.lingvoforum.net/w/%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Bhudh/Plage#.D0.9A.D0.BD.D0.B8.D0.B3.D0.B8) — это именно текстовый слой из DjVu.
А «пере-перенос» это не баг, а такая фича для поиска по тексту.
Только не знаю, кем она генеруется, распознавателем или самим вьюером.
Цитата: RawonaM от августа 7, 2011, 10:04
PDF прочитают все, ДжВю — избранные.
Если есть обновление, то ПДФ прочитают, а если нет, то не все файлы можно прочитать.
Цитата: Bhudh от августа 8, 2011, 16:17
Пара книжек отсюда — это именно текстовый слой из DjVu.
не сочтите за приставания, но... нельзя ли эти книги "пощупать"? По информации из ФФ на тех страницах нет djvu :( а есть txt/html
:D
Понятно, в LW DjVu нет. Из него я копипастил.
Цитата: Bhudh от августа 8, 2011, 22:47
:D
Понятно
грешно смеяться над больными людьми :( (с)
Что, объяснить никто не желает? Всем абы тока поржать? :( Ну и...
ЗЫ. а ведь только подумалось, что хоть здесь адекваты собрались :(
Ну не обижайтесь... На самом деле страницы DjVu с текстовым слоем в Инете существуют.
Как пример хотя бы вот эта ссылка (http://ia600303.us.archive.org/13/items/anetymologicald00valpgoog/anetymologicald00valpgoog.djvu) (осторожно, там на 30 метров файл).
Цитата: Bhudh от августа 8, 2011, 22:53
DjVu с текстовым слоем в Инете существуют
так всё же через ФР? Но смысл? Почему не делать rtf?
Цитата: Kern_Nata от так всё же через ФР? Но смысл?
Я тоже не поняʌ смысʌ вопроса... :what:
PS.
DJVU Image (2738x5040, 300 dpi) version 25:
0.0 Kb 'INFO' Page information.
0.0 Kb 'CIDa' Unrecognized chunk.
47.9 Kb 'Sjbz' JB2 foreground mask (2738x5040, 300 dpi).
3.9 Kb 'TXTz' Text (text, etc.).
Compression ratio: 779 (51.9 Kb)
Sjbz=jb2file
Create a JB2 foreground mask chunk. File jb2file may contain raw JB2 data, or be a DjVu file containing JB2 data such as those produced by program cjb2.
Спецификация формата (http://www.djvuzone.org/djvu/djvu/djvuspec/)
Таки это не текст :) а текстовый
слой
Цитата: Bhudh от августа 8, 2011, 23:02
Я тоже не поняʌ смысʌ вопроса... :what:
Если это обычный текст (txt), то "загонять" его в рамки DjVu нет смысла, лучше сразу сделать fb2 or rtf
Здесь же - текстовый (OCR) слой на графике :)
Да, таких файлов - море!
А я что написал⁈
Цитата: Bhudh от августа 8, 2011, 22:53страницы DjVu с текстовым слоем
А «текстовый DjVu» — это абсурд какой-то... Это же графический формат...
Текстовый BMP бывает?
P.S. Позор! Сама спецификация — без текстового слоя! :fp:
Цитата: Kern_Nata от Если это обычный текст (txt), то "загонять" его в рамки DjVu нет смысла, лучше сразу сделать fb2 or rtf
Так смысл DjVu — в отображении исходного вида книги! А текст: дополнительная полезная фича.
Цитата: Bhudh от августа 8, 2011, 23:06
А «текстовый DjVu» — это абсурд какой-то... Это же графический формат...
А я ж о чем?!
Цитата: Bhudh от августа 8, 2011, 23:08
А текст: дополнительная полезная фича.
И я о том же!
Цитата: RawonaM от августа 7, 2011, 21:21
Цитата: arseniiv от августа 7, 2011, 20:56
У меня был какой-то DjVu-файл с текстом.
Разыскивается не с текстом, а из текста.
Или я здесь чё-та... :-[
Ну, просю пардону...
:UU:
:donno: файл с текстом, файл из текста...
Значит, мы о том же самом. :???
Но я так и не понял про ФР (http://lingvoforum.net/index.php/topic,37069.msg964933.html#msg964933).
Цитата: Bhudh от августа 8, 2011, 23:13
Но я так и не понял про ФР.
Интересует простой и надежный способ "засунуть" в графику слой текста :( Через FineReader (FR=ФР)?
А-а-а! Я подумал, FR = français... И думаю, где там он?‥