Лингвофорум

Общий раздел => Наука и техника => Компьютеры => Тема начата: Hellerick от августа 6, 2011, 06:30

Название: Форматы книг
Отправлено: Hellerick от августа 6, 2011, 06:30
Бесит популярность формата PDF для электронных публикаций.

Зачем нужна эта компьютерная имитация недостатков бумаги?
Название: Форматы книг
Отправлено: basta от августа 6, 2011, 07:34
.txt for ever
Название: Форматы книг
Отправлено: basta от августа 6, 2011, 07:36
Цитата: Hellerick от августа  6, 2011, 06:30
Зачем нужна эта компьютерная имитация недостатков бумаги?
капитализм ?
Название: Форматы книг
Отправлено: Alone Coder от августа 6, 2011, 07:37
А там есть примитивный способ защиты от копирования документа и цитирования. Правда, тогда непонятно, почему многие юзают PDF без защиты.
Название: Форматы книг
Отправлено: Alexandra A от августа 6, 2011, 08:11
Цитата: Hellerick от августа  6, 2011, 06:30
Бесит популярность формата PDF для электронных публикаций.

Зачем нужна эта компьютерная имитация недостатков бумаги?

Лучше обычный .html формат. Причём чтобы весь текст на одной, ну или нескольких страницах (немногих).

Копируешь с помощью Ctrl+C Ctrl+V в пограмму Microsoft Word, редактируешь текст (чтобы было меньше страниц) и распечатываешь...

.pdf распечатывать - слишком много бумаги. Вот это бесит!

Всё что мне интересно - всё печатаю на бумагу.
Название: Форматы книг
Отправлено: Bhudh от августа 6, 2011, 08:13
Цитата: Alexandra A от Причём чтобы весь текст на одной, ну или нескольких страницах (немногих).
Пробовал я открывать xmlʼки из docx... Тихий ужас на 30 мегабайт представляете?
Название: Форматы книг
Отправлено: Dana от августа 6, 2011, 08:15
Цитата: Hellerick от августа  6, 2011, 06:30
Бесит популярность формата PDF для электронных публикаций.

Зачем нужна эта компьютерная имитация недостатков бумаги?
А мне как раз только PDF и нравится. Предпочитаю его всем остальным.
Бесят две вещи: когда книги запихивают в формат .docx и популяризация формата DejaVu.
Название: Форматы книг
Отправлено: Alexandra A от августа 6, 2011, 08:35
Цитата: Bhudh от августа  6, 2011, 08:13
Цитата: Alexandra A от Причём чтобы весь текст на одной, ну или нескольких страницах (немногих).
Пробовал я открывать xmlʼки из docx... Тихий ужас на 30 мегабайт представляете?

Я не совсем понимаю что это такое...

Меня не волнует размер файла. На компьютере ведь много места, 300 GB жёсткий диск.

Мне главное чтобы быстрее распечатать текст, при редактировании тратить как можно меньше времени, и чтобы меньше бумаги при распечатывании.

Кода на бумаге есть - я спокойна.
Название: Форматы книг
Отправлено: Bhudh от августа 6, 2011, 08:48
Цитата: Alexandra A от Меня не волнует размер файла.
Плэıн-текст в 30 метров открывается куда муторнее, чем спецформат в те же 30 метров.
Название: Форматы книг
Отправлено: Hellerick от августа 6, 2011, 08:50
Цитата: basta от августа  6, 2011, 07:34
.txt for ever

Ну... В принципе, да.

Идеальным форматом для хранения и передачи текста я считаю TXT с вики-разметкой. Он наиболее гибок — его проще всего превратить во что-угодно.
Название: Форматы книг
Отправлено: Hellerick от августа 6, 2011, 08:52
Цитата: Bhudh от августа  6, 2011, 08:13
Пробовал я открывать xmlʼки из docx... Тихий ужас на 30 мегабайт представляете?

А зачем это делать?

И не надо путать людей, в плане величины файла docx — весьма экономичный формат.
Название: Форматы книг
Отправлено: Bhudh от августа 6, 2011, 08:54
Цитата: Hellerick от в плане величины файла docx — весьма экономичный формат.
Ещё бы — txt в zipʼе!
Но выглядит хорошо, только когда Вордом открывается...
Хотя, спрашивается, зачем для XMLʼя такая дура, как Ворд?‥
Название: Форматы книг
Отправлено: Hellerick от августа 6, 2011, 09:00
Цитата: Bhudh от августа  6, 2011, 08:54
Ещё бы — txt в zipʼе!

По моему это наиболее кошерно — сочетание компактности с человекочитаемостью.

Хотя, конечно, читая собственно код, убеждаешься в его дебилизме. Восемь раз в одном абзаце указывать, что он написан на американском английском это как бы не совсем хорошо.
Название: Форматы книг
Отправлено: Hellerick от августа 6, 2011, 09:05
Цитата: Alexandra A от августа  6, 2011, 08:35
Кода на бумаге есть - я спокойна.

Бумага не нужна.
Название: Форматы книг
Отправлено: Hellerick от августа 6, 2011, 09:05
Цитата: Bhudh от августа  6, 2011, 08:54
зачем для XMLʼя такая дура, как Ворд?‥

Какая странная постановка вопроса.
Название: Форматы книг
Отправлено: sasza от августа 6, 2011, 09:08
Цитата: Dana от августа  6, 2011, 08:15
А мне как раз только PDF и нравится. Предпочитаю его всем остальным.
Бесят две вещи: когда книги запихивают в формат .docx и популяризация формата DejaVu.
Pdf и Djvu рулят. У каждого своё применение.

Бесит "Йцукен"-раскладка. Уже привык к фонетической на клавиатуре без русских букв, а тут реанимировал свой старый десктоп с русской клавиатурой.
Название: Форматы книг
Отправлено: Dana от августа 6, 2011, 09:15
Цитата: sasza от августа  6, 2011, 09:08
Бесит "Йцукен"-раскладка. Уже привык к фонетической на клавиатуре без русских букв, а тут реанимировал свой старый десктоп с русской клавиатурой.
У меня Йцукен и клавиатура без русских букв, проблем не возникает.
Название: Форматы книг
Отправлено: Bhudh от августа 6, 2011, 09:33
Цитата: Hellerick от Хотя, конечно, читая собственно код, убеждаешься в его дебилизме. Восемь раз в одном абзаце указывать, что он написан на американском английском это как бы не совсем хорошо.
Когда я вижу сайты, сверстанные в Ворде, мне хочется вырезать и выкинуть из кода процентов 95.

Цитата: Hellerick от Какая странная постановка вопроса.
То есть Вы согласны, что парсер XML должен занимать полгига? :umnik:
Название: Форматы книг
Отправлено: Hellerick от августа 6, 2011, 09:35
Цитата: Bhudh от августа  6, 2011, 09:33
Цитата: Hellerick от Какая странная постановка вопроса.
То есть Вы согласны, что парсер XML должен занимать полгига? :umnik:

Не понимаю об чем вы.
Название: Форматы книг
Отправлено: RawonaM от августа 6, 2011, 10:03
Цитата: Hellerick от августа  6, 2011, 06:30
Бесит популярность формата PDF для электронных публикаций.

Зачем нужна эта компьютерная имитация недостатков бумаги?
Затем, чтобы документ выглядел у всех так, как ты задумал и как он выглядит у тебя. Никакой другой формат пока что этого не умеет.
Название: Форматы книг
Отправлено: Kern_Nata от августа 6, 2011, 10:26
Бесит не формат, а человек, его выбирающий :)
Зачем сохранять в DjVu и терять качество, если лучше сохранить в отменном виде, но в pdf?
Для разных целей и разной информации ИМХО люди выбирают подходящий формат.
Название: Форматы книг
Отправлено: RawonaM от августа 6, 2011, 10:34
Цитата: Kern_Nata от августа  6, 2011, 10:26
Зачем сохранять в DjVu и терять качество, если лучше сохранить в отменном виде, но в pdf?
Зачем сохранять в JPG и терять качество, если можно в BMP в отменном виде? Затем, чтобы снизить на несколько порядков размер файла.
Если речь идет о ПДФ с электронным текстом, то конечно выбирать ДжВу неразумно. Но речь раньше шла вроде о том, зачем вообще ПДФ нужен.

Цитата: Kern_Nata от августа  6, 2011, 10:26
Для разных целей и разной информации ИМХО люди выбирают подходящий формат.
Совершенно верно, поэтому иногда ДеЖавю формат более подходящий.
Название: Форматы книг
Отправлено: Bhudh от августа 6, 2011, 10:35
Цитата: RawonaM от Никакой другой формат пока что этого не умеет.
Умеет. JPEG. :smoke:
Название: Форматы книг
Отправлено: RawonaM от августа 6, 2011, 10:40
Цитата: Bhudh от августа  6, 2011, 10:35
Цитата: RawonaM от Никакой другой формат пока что этого не умеет.
Умеет. JPEG. :smoke:
Надеюсь, все оценили шутку.
Название: Форматы книг
Отправлено: Kern_Nata от августа 6, 2011, 10:59
Сообщений: 777

Это было красиво, да... :)
Цитата: Bhudh от августа  6, 2011, 10:35
JPEG
доооооооооо! прогрессивный и шибкосжатый :)
Название: Форматы книг
Отправлено: Hellerick от августа 6, 2011, 11:01
Цитата: Bhudh от августа  6, 2011, 10:35
Цитата: RawonaM от Никакой другой формат пока что этого не умеет.
Умеет. JPEG. :smoke:

JPEG не бывает многостраничным.
Название: Форматы книг
Отправлено: Alone Coder от августа 6, 2011, 16:49
Цитата: Dana от августа  6, 2011, 08:15
Бесят две вещи: когда книги запихивают в формат .docx и популяризация формата DejaVu.
Чем вас не устраивает стандартный, открытый формат DjVu, вьювер которого работает в разы быстрее PDFовского при сжатии в разы сильнее?
Название: Форматы книг
Отправлено: Joris от августа 6, 2011, 16:51
Цитата: Dana от августа  6, 2011, 08:15
когда книги запихивают в формат .docx
+1
Цитата: Dana от августа  6, 2011, 08:15
и популяризация формата DejaVu.
-1
Название: Форматы книг
Отправлено: Alone Coder от августа 6, 2011, 16:51
Цитата: RawonaM от августа  6, 2011, 10:03
Затем, чтобы документ выглядел у всех так, как ты задумал и как он выглядит у тебя. Никакой другой формат пока что этого не умеет.
PDF это как раз и не умеет. Шрифты с крокозябрами и налезающие буквы какбэ намекают.
Название: Форматы книг
Отправлено: Bhudh от августа 6, 2011, 16:53
Цитата: Alone Coder от Шрифты с крокозябрами и налезающие буквы какбэ намекают.
Это вина не формата, а самих махеров и невстроения фонтов.
Название: Форматы книг
Отправлено: Dana от августа 6, 2011, 17:43
Цитата: Alone Coder от августа  6, 2011, 16:49
Чем вас не устраивает стандартный, открытый формат DjVu, вьювер которого работает в разы быстрее PDFовского при сжатии в разы сильнее?
А мне не нравится, как отображаются документы в нём.

Цитата: Alone Coder от августа  6, 2011, 16:51
PDF это как раз и не умеет. Шрифты с крокозябрами и налезающие буквы какбэ намекают.
Шрифты встраивать нужно.
Название: Форматы книг
Отправлено: ginkgo от августа 6, 2011, 18:51
Цитата: Bhudh от августа  6, 2011, 09:33
Когда я вижу сайты, сверстанные в Ворде, мне хочется вырезать и выкинуть из кода процентов 95.
Кстати, аналогично  :UU:   Одно время прямо навязчивая идея была :)
Название: Форматы книг
Отправлено: Triton от августа 6, 2011, 19:08
Цитата: Hellerick от августа  6, 2011, 06:30
Бесит популярность формата PDF для электронных публикаций.

Зачем нужна эта компьютерная имитация недостатков бумаги?
Пережитки эпохи, когда принтер еще был актуальным девайсом.
Название: Форматы книг
Отправлено: Dana от августа 6, 2011, 19:10
Какие недостатки-то?
Название: Форматы книг
Отправлено: arseniiv от августа 6, 2011, 19:10
Цитата: Dana от августа  6, 2011, 17:43
А мне не нравится, как отображаются документы в нём.
Я всегда думал, что это формат большей частью для сканированных книг. Не понимаю людей, если они используют его для другого.
У меня есть несколько книг в DJVU, почти все читаются на ура. У некоторых просто недостаточное качество сканирования.

Цитата: Bhudh от августа  6, 2011, 09:33
Когда я вижу сайты, сверстанные в Ворде, мне хочется вырезать и выкинуть из кода процентов 95.
Я всегда думал, что Ага. По крайней мере, версии 2000–2003 дают ужасный код, а другие не проверял, но следует ожидать... Не понимаю людей, если они используют Word в качестве html-редактора.

Цитата: Alexandra A от августа  6, 2011, 08:35
Меня не волнует размер файла. На компьютере ведь много места, 300 GB жёсткий диск.
Только вы такие тексты не рассылайте знакомым.
Название: Форматы книг
Отправлено: Triton от августа 6, 2011, 19:10
Цитата: Hellerick от августа  6, 2011, 08:50
Идеальным форматом для хранения и передачи текста я считаю TXT с вики-разметкой. Он наиболее гибок — его проще всего превратить во что-угодно.
:+1:
Название: Форматы книг
Отправлено: Triton от августа 6, 2011, 19:13
Цитата: RawonaM от августа  6, 2011, 10:03
Затем, чтобы документ выглядел у всех так, как ты задумал и как он выглядит у тебя. Никакой другой формат пока что этого не умеет.
А зачем это нужно в статье, выложенной в сети? В html нужно выкладывать — ну а каждый как захочет, так и распечатает, если потребуется.
Название: Форматы книг
Отправлено: RawonaM от августа 6, 2011, 19:15
Цитата: Triton от августа  6, 2011, 19:13
Цитата: RawonaM от августа  6, 2011, 10:03Затем, чтобы документ выглядел у всех так, как ты задумал и как он выглядит у тебя. Никакой другой формат пока что этого не умеет.
А зачем это нужно в статье, выложенной в сети?
Вопросы зачем нужен формат и зачем его неправильно применяют — это разные и несвязанные вопросы.
Название: Форматы книг
Отправлено: Dana от августа 6, 2011, 19:15
Цитата: Triton от августа  6, 2011, 19:13
А зачем это нужно в статье, выложенной в сети? В html нужно выкладывать — ну а каждый как захочет, так и распечатает, если потребуется.
Попробуйте статью по физике в html выложить, ага. С кучей формул.
Название: Форматы книг
Отправлено: RawonaM от августа 6, 2011, 19:18
Цитата: Dana от августа  6, 2011, 19:15
Попробуйте статью по физике в html выложить, ага. С кучей формул.
XHTML 5 уже поддерживает.
Только каждый браузер все равно что хочет то и делает.

Кстати касательно распечатки хтмл: сноски и ссылки типа «см. страницу 25» потеряют смысл. Так что ПДФу еще жить, пока не появятся годные замены.
Название: Форматы книг
Отправлено: Hellerick от августа 6, 2011, 19:18
Цитата: Dana от августа  6, 2011, 19:15
Цитата: Triton от августа  6, 2011, 19:13
А зачем это нужно в статье, выложенной в сети? В html нужно выкладывать — ну а каждый как захочет, так и распечатает, если потребуется.
Попробуйте статью по физике в html выложить, ага. С кучей формул.

А в вики — запросто.
Название: Форматы книг
Отправлено: Hellerick от августа 6, 2011, 19:20
Кстати, благодаря наличию сервисов типа latex.codecogs.com формулы и в html перестают быть заметной проблемой.
Название: Форматы книг
Отправлено: RawonaM от августа 6, 2011, 19:34
Цитата: Hellerick от августа  6, 2011, 19:20
Кстати, благодаря наличию сервисов типа latex.codecogs.com формулы и в html перестают быть заметной проблемой.
Они и без него уже не проблема. Вот хочу чтоб на лф вместо кодекогса был нативный хтмл, но некогда этим заниматься.
Название: Форматы книг
Отправлено: Vertaler от августа 6, 2011, 23:47
Цитата: Dana от августа  6, 2011, 19:15
Цитата: Triton от августа  6, 2011, 19:13
А зачем это нужно в статье, выложенной в сети? В html нужно выкладывать — ну а каждый как захочет, так и распечатает, если потребуется.
Попробуйте статью по физике в html выложить, ага. С кучей формул.
Это ещё фигня.

Работы по славянской акцентуации или по эвенкийскому в формате doc нести с компьютера с семёркой на компьютер с ХР, чтобы распечатать — это номер.
Название: Форматы книг
Отправлено: Dana от августа 7, 2011, 00:06
Ещё одно дополнение.
Не так давно, в пору, когда у меня сломался принтер, потребовалось мне распечатать текст с греческой политоникой. Подумав, что ничего особо экзотического там нет, не стала конвертировать .docx в PDF (хотя обычно так делаю). Распечатала в копи-центре. И что бы вы думали? На месте греческих букв с диакритиками стояли квадратики!
Название: Форматы книг
Отправлено: mnashe от августа 7, 2011, 09:28
Цитата: Alexandra A от августа  6, 2011, 08:11
Лучше обычный .html формат. Причём чтобы весь текст на одной, ну или нескольких страницах (немногих).
+1
Цитата: Alexandra A от августа  6, 2011, 08:11
Копируешь с помощью Ctrl+C Ctrl+V в пограмму Microsoft Word, редактируешь текст (чтобы было меньше страниц) и распечатываешь...
−1
Цитата: Dana от августа  6, 2011, 08:15
Бесят две вещи: когда книги запихивают в формат .docx
+1
Цитата: Dana от августа  6, 2011, 08:15
и популяризация формата DejaVu.
−1
Название: Форматы книг
Отправлено: mnashe от августа 7, 2011, 09:37
Цитата: ginkgo от августа  6, 2011, 18:51
Цитата: Bhudh от августа  6, 2011, 09:33
Когда я вижу сайты, сверстанные в Ворде, мне хочется вырезать и выкинуть из кода процентов 95.
Кстати, аналогично  :UU:   Одно время прямо навязчивая идея была :)
У меня это зашло ещё дальше: я много раз проделывал эту процедуру.
Более того, я даже написал две программы, поддерживающие простенькие скрипты (в каждой — свой), существенно ускоряющие эту работу. Одна делает замены в любом файле, другая специально ориентирована на обработку HTML-тегов.
И всё равно удаление MS-мусора нередко занимает кучу времени (но это от вёрстки зависит — при хорошей вёрстке времени уходит намного меньше, чем при хаотической).
Название: Форматы книг
Отправлено: mnashe от августа 7, 2011, 09:54
Цитата: Dana от августа  6, 2011, 09:15
У меня Йцукен и клавиатура без русских букв, проблем не возникает.
:+1:
А дома есть и самодельная фонетическая — для жены.

Цитата: Alone Coder от августа  6, 2011, 16:49
Чем вас не устраивает стандартный, открытый формат DjVu, вьювер которого работает в разы быстрее PDFовского при сжатии в разы сильнее?
:+1:

Цитата: RawonaM от августа  6, 2011, 10:34
Если речь идет о ПДФ с электронным текстом, то конечно выбирать ДжВу неразумно.
Однако djvu тоже поддерживает формат с электронным текстом. Я не заметил у него ни недостатков, ни преимуществ по сравнению с аналогичным pdf.

Цитата: RawonaM от августа  6, 2011, 10:34
Совершенно верно, поэтому иногда ДеЖавю формат более подходящий.
Ярче всего преимущество djvu на больших чёрно-белых растровых файлах: большой выигрыш в скорости и размере.
А djvu-photo при равном качестве занимает примерно столько же места, как аналогичный pdf.
Название: Форматы книг
Отправлено: RawonaM от августа 7, 2011, 10:04
Цитата: mnashe от августа  7, 2011, 09:54
Цитата: RawonaM от августа  6, 2011, 10:34Если речь идет о ПДФ с электронным текстом, то конечно выбирать ДжВу неразумно.
Однако djvu тоже поддерживает формат с электронным текстом. Я не заметил у него ни недостатков, ни преимуществ по сравнению с аналогичным pdf.
Я не в курсе, но по-моему ДжВю очень ограничен. Кроме того, ограничена его поддержка. PDF прочитают все, ДжВю — избранные.
Название: Форматы книг
Отправлено: RawonaM от августа 7, 2011, 10:05
Я вообще не видел джвю текстовых, только картиночные. Можно мне показать пример текстового ДжВю?
Название: Форматы книг
Отправлено: mnashe от августа 7, 2011, 10:06
Конечно, в тех областях, где pdf не уступает djvu, лучше обходиться им.
Правда, есть ещё фактор медлительности вьюера (даже foxit).
Название: Форматы книг
Отправлено: mnashe от августа 7, 2011, 10:07
Цитата: RawonaM от августа  7, 2011, 10:05
Я вообще не видел джвю текстовых, только картиночные. Можно мне показать пример текстового ДжВю?
Поищу дома, если не забуду.
Или на инфанате.
Название: Форматы книг
Отправлено: RawonaM от августа 7, 2011, 10:37
(wiki/en) DjVu (http://en.wikipedia.org/wiki/DjVu)
Ничего про его полную альтернативу ПДФ не написано, только для сканированных документов.
Название: Форматы книг
Отправлено: Python от августа 7, 2011, 10:52
Текстовый djvu — т.е., хранящий текст в виде последовательности символьных кодов? Основное предназначение djvu — сканы книг. Все остальное выглядит как попытка превратить его в нечто универсальное (но тогда зачем djvu, если уже есть pdf?)
ЦитироватьЛучше обычный .html формат. Причём чтобы весь текст на одной, ну или нескольких страницах (немногих).
ІМНО, pdf удобнее, как минимум, возможностью нормально организовать навигацию по документу. Правильный pdf с закладками разделов на боковой панели намного удобнее, чем длинное html-полотно с содержанием где-то в самом начале. Конечно, можно имитировать pdf-овскую панель закладок, использовав фреймы, но это уже получится три файла вместо одного (фреймсет, содержание, сам документ), и редко кто так делает. Удобно, если весь документ в одном файле, а не текст отдельно, иллюстрации отдельно. Удобно, если есть возможность легко добавить или исправить содержание (механизм закладок в pdf для этого идеален — их можно редактировать непосредственно в фоксите; html в этом отношении менее удобен). И да, отсутствие нумерации страниц в длинном html — тоже минус.

Основной минус pdf — то, что он бинарный, из чего следует сложность создания, редактирования, автоматической обработки данных из него. Но это скорее неудобства для программиста, чем для пользователя.

p.s. Еще следует вспомнить о нестандартных шрифтах, которые в pdf встраиваются без проблем, а в html подгружаются непонятно-как, во всех браузерах подгружаются по-разному, а в некоторых не подгружаются вообще.
Название: Форматы книг
Отправлено: RawonaM от августа 7, 2011, 10:54
Цитата: Python от августа  7, 2011, 10:52
Текстовый djvu — т.е., хранящий текст в виде последовательности символьных кодов? Основное предназначение djvu — сканы книг. Все остальное выглядит как попытка превратить его в нечто универсальное (но тогда зачем djvu, если уже есть pdf?)
+1
Название: Форматы книг
Отправлено: Kern_Nata от августа 7, 2011, 10:59
Цитата: Python от августа  7, 2011, 10:52
Основное предназначение djvu — сканы книг
Чаще всего - "черных" сканов или в градациях серого. Цветные книги да еще и с качественными иллюстрациями - это pdf.
Кстати, я так и не умею до сих пор текстовый слой вставлять в DjVu :(
Название: Форматы книг
Отправлено: Hellerick от августа 7, 2011, 15:17
Цитата: Python от августа  7, 2011, 10:52
Основной минус pdf — то, что он бинарный, из чего следует сложность создания, редактирования, автоматической обработки данных из него. Но это скорее неудобства для программиста, чем для пользователя.

Основной минус PDF — в ненастраиваемости.

Какой бы идеальной не была верста PDF-документа, для большинства пользователей (как «бумажных» так и «экранных») она окажется хуже, чем могла бы быть.

У всех разные технические условия работы с документом, и каждому необходимо дать возможность подстроить под них документ.
Название: Форматы книг
Отправлено: Kern_Nata от августа 7, 2011, 17:23
Цитата: Hellerick от августа  7, 2011, 15:17
верста PDF-документа окажется хуже, чем могла бы быть.
Как-то туманно, как-то непонятно:(
А это что: возможность подстроить документ под технические условия?
Название: Форматы книг
Отправлено: Hellerick от августа 7, 2011, 18:03
Цитата: Kern_Nata от августа  7, 2011, 17:23
Цитата: Hellerick от августа  7, 2011, 15:17
верста PDF-документа окажется хуже, чем могла бы быть.
Как-то туманно, как-то непонятно:(
А это что: возможность подстроить документ под технические условия?

Изменить размер шрифта, сменить гарнитуру, разбить на две колонки, сменить цветовую схему и т.п.

То, что хорошо на моем ноутбуке, будет по-идиотски смотреться на моем HD мониторе, десу же.
Название: Форматы книг
Отправлено: Kern_Nata от августа 7, 2011, 19:37
Spoiler: Обзор существующих форматов электронных книг ⇓⇓⇓


Spoiler: Обычный текст (plain text) (.TXT) ⇓⇓⇓


Spoiler: Rich Text Format (.RTF) ⇓⇓⇓


Spoiler: Документ Microsoft Word (.DOC) ⇓⇓⇓


Spoiler: Документы HTML (.HTM; .CHM; .MHT) ⇓⇓⇓

ЦитироватьУ всех вышеперечисленных форматов есть один существенный недостаток — они ИЗНАЧАЛЬНО НЕ ПРЕДНАЗНАЧАЛИСЬ для создания электронных книг. Созданные на их основе файлы даже не являются книгами — это просто текстовые документы. Но, как ни странно, из этого же недостатка вытекает и достоинство: чтобы читать их, не требуется специального программного обеспечения. Достаточно стандартных средств, встроенных в операционную систему. Форматы, описанные далее, уже требуют установки специальных программ для их просмотра.
Название: Форматы книг
Отправлено: Kern_Nata от августа 7, 2011, 19:39
Spoiler: Adobe Acrobat (.PDF) ⇓⇓⇓


Spoiler: DeJaVU (.DJVU) ⇓⇓⇓
Название: Форматы книг
Отправлено: Kern_Nata от августа 7, 2011, 19:43
Всех иных, конечно, лучше формат FictionBook 2
Название: Форматы книг
Отправлено: mnashe от августа 7, 2011, 19:48
Kern_Nata, спасибо, всё кратко и толково.

Цитата: RawonaM от августа  7, 2011, 10:05
Я вообще не видел джвю текстовых, только картиночные. Можно мне показать пример текстового ДжВю?
Пока что попался один djvu файл, полученный из doc, и он оказался растровым :(
Может, я просто раньше невнимательно смотрел?
Буду проверять по мере натыкания.
Название: Форматы книг
Отправлено: Kern_Nata от августа 7, 2011, 19:50
Цитата: mnashe от августа  7, 2011, 19:48
Пока что попался один djvu файл, полученный из doc
А это как? Что за конвертор???
Название: Форматы книг
Отправлено: mnashe от августа 7, 2011, 19:51
Цитата: Kern_Nata от августа  7, 2011, 19:50
Цитата: mnashe от августа  7, 2011, 19:48
Пока что попался один djvu файл, полученный из doc
А это как? Что за конвертор???
Не знаю, не моё.
Просто качаю с инфанаты.
Название: Форматы книг
Отправлено: Kern_Nata от августа 7, 2011, 19:53
DEE имеет модуть окаэривания, то только инглиша;.. а "вжигание" текстового слоя в него идет через ФР

Чтоб из Ворда - ... впервые слышу!
Название: Форматы книг
Отправлено: arseniiv от августа 7, 2011, 20:56
У меня был какой-то DjVu-файл с текстом. Не помню, где он. Помню только, что при копировании слов с переносами типа «пере-//нос» получалось примерно или точно такое: «пере-перенос». Не знаю, недостатки ли это лично её текстового слоя, читалки или формата.
Название: Форматы книг
Отправлено: RawonaM от августа 7, 2011, 21:21
Цитата: arseniiv от августа  7, 2011, 20:56
У меня был какой-то DjVu-файл с текстом.
Разыскивается не с текстом, а из текста.
Название: Форматы книг
Отправлено: Kern_Nata от августа 7, 2011, 21:35
Цитата: RawonaM от августа  7, 2011, 21:21
а из текста.
таких нет :)
текстовых слой накладывается на графику
Название: Форматы книг
Отправлено: arseniiv от августа 8, 2011, 12:11
DjV'ями из текста не торгую. У меня по этой части PDF несколько.
Название: Форматы книг
Отправлено: Bhudh от августа 8, 2011, 16:17
Цитата: mnashe от У меня это зашло ещё дальше: я много раз проделывал эту процедуру.
Да я тоже несколько раз.
До скриптов дело не дошло — регулярки ленно учить.

Цитата: arseniiv от У меня был какой-то DjVu-файл с текстом. Не помню, где он. Помню только, что при копировании слов с переносами типа «пере-//нос» получалось примерно или точно такое: «пере-перенос». Не знаю, недостатки ли это лично её текстового слоя, читалки или формата.
Пара книжек отсюда (http://wiki.lingvoforum.net/w/%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Bhudh/Plage#.D0.9A.D0.BD.D0.B8.D0.B3.D0.B8) — это именно текстовый слой из DjVu.
А «пере-перенос» это не баг, а такая фича для поиска по тексту.
Только не знаю, кем она генеруется, распознавателем или самим вьюером.
Название: Форматы книг
Отправлено: Лукас от августа 8, 2011, 16:29
Цитата: RawonaM от августа  7, 2011, 10:04
PDF прочитают все, ДжВю — избранные.
Если есть обновление, то ПДФ прочитают, а если нет, то не все файлы можно прочитать.
Название: Форматы книг
Отправлено: Kern_Nata от августа 8, 2011, 17:07
Цитата: Bhudh от августа  8, 2011, 16:17
Пара книжек отсюда — это именно текстовый слой из DjVu.
не сочтите за приставания, но... нельзя ли эти книги "пощупать"? По информации из ФФ на тех страницах нет djvu :( а есть txt/html
Название: Форматы книг
Отправлено: Bhudh от августа 8, 2011, 22:47
:D
Понятно, в LW DjVu нет. Из него я копипастил.
Название: Форматы книг
Отправлено: Kern_Nata от августа 8, 2011, 22:51
Цитата: Bhudh от августа  8, 2011, 22:47
:D
Понятно
грешно смеяться над больными людьми :( (с)

Что, объяснить никто не желает? Всем абы тока поржать? :( Ну и...
Название: Форматы книг
Отправлено: Kern_Nata от августа 8, 2011, 22:52
ЗЫ. а ведь только подумалось, что хоть здесь адекваты собрались :(
Название: Форматы книг
Отправлено: Bhudh от августа 8, 2011, 22:53
Ну не обижайтесь... На самом деле страницы DjVu с текстовым слоем в Инете существуют.
Как пример хотя бы вот эта ссылка (http://ia600303.us.archive.org/13/items/anetymologicald00valpgoog/anetymologicald00valpgoog.djvu) (осторожно, там на 30 метров файл).
Название: Форматы книг
Отправлено: Kern_Nata от августа 8, 2011, 22:58
Цитата: Bhudh от августа  8, 2011, 22:53
DjVu с текстовым слоем в Инете существуют
так всё же через ФР? Но смысл? Почему не делать rtf?
Название: Форматы книг
Отправлено: Bhudh от августа 8, 2011, 23:02
Цитата: Kern_Nata от так всё же через ФР? Но смысл?
Я тоже не поняʌ смысʌ вопроса... :what:
Название: Форматы книг
Отправлено: Kern_Nata от августа 8, 2011, 23:03
PS.


Sjbz=jb2file
    Create a JB2 foreground mask chunk. File jb2file may contain raw JB2 data, or be a DjVu file containing JB2 data such as those produced by program cjb2.
Спецификация формата (http://www.djvuzone.org/djvu/djvu/djvuspec/)
Таки это не текст :) а текстовый слой
Название: Форматы книг
Отправлено: Kern_Nata от августа 8, 2011, 23:04
Цитата: Bhudh от августа  8, 2011, 23:02
Я тоже не поняʌ смысʌ вопроса... :what:
Если это обычный текст (txt), то "загонять" его в рамки DjVu нет смысла, лучше сразу сделать fb2 or rtf
Здесь же - текстовый (OCR) слой на графике :)
Да, таких файлов - море!
Название: Форматы книг
Отправлено: Bhudh от августа 8, 2011, 23:06
А я что написал⁈
Цитата: Bhudh от августа  8, 2011, 22:53страницы DjVu с текстовым слоем

А «текстовый DjVu» — это абсурд какой-то... Это же графический формат...
Текстовый BMP бывает?

P.S. Позор! Сама спецификация — без текстового слоя! :fp:
Название: Форматы книг
Отправлено: Bhudh от августа 8, 2011, 23:08
Цитата: Kern_Nata от Если это обычный текст (txt), то "загонять" его в рамки DjVu нет смысла, лучше сразу сделать fb2 or rtf
Так смысл DjVu — в отображении исходного вида книги! А текст: дополнительная полезная фича.
Название: Форматы книг
Отправлено: Kern_Nata от августа 8, 2011, 23:09
Цитата: Bhudh от августа  8, 2011, 23:06
А «текстовый DjVu» — это абсурд какой-то... Это же графический формат...
А я ж о чем?!
Цитата: Bhudh от августа  8, 2011, 23:08
А текст: дополнительная полезная фича.
И я о том же!
Название: Форматы книг
Отправлено: Kern_Nata от августа 8, 2011, 23:12
Цитата: RawonaM от августа  7, 2011, 21:21
Цитата: arseniiv от августа  7, 2011, 20:56
У меня был какой-то DjVu-файл с текстом.
Разыскивается не с текстом, а из текста.
Или я здесь чё-та... :-[

Ну, просю пардону...

:UU:

:donno: файл с текстом, файл из текста...
Название: Форматы книг
Отправлено: Bhudh от августа 8, 2011, 23:13
Значит, мы о том же самом. :???

Но я так и не понял про ФР (http://lingvoforum.net/index.php/topic,37069.msg964933.html#msg964933).
Название: Форматы книг
Отправлено: Kern_Nata от августа 8, 2011, 23:14
Цитата: Bhudh от августа  8, 2011, 23:13
Но я так и не понял про ФР.
Интересует простой и надежный способ "засунуть" в графику слой текста :(  Через FineReader (FR=ФР)?
Название: Форматы книг
Отправлено: Bhudh от августа 8, 2011, 23:22
А-а-а! Я подумал, FR = français... И думаю, где там он?‥