Лингвофорум

Общий раздел => Наука и техника => Компьютеры => Тема начата: Demetrius от декабря 24, 2011, 23:53

Название: Plain text
Отправлено: Demetrius от декабря 24, 2011, 23:53
Нет ничего лучше обычного текста.

Люди, гонясь за внешним видом, забывают о смысле.


Вместо локальной вики достаточно обычного текстового редактора с поддержкой открытия файлов по какому-то щелчку (например, пусть бы это был двойной правый щелчок).


Проект Гутенберг всё делает правильно.
Название: Plain text
Отправлено: Bhudh от декабря 24, 2011, 23:57
Проект Гутенберг конвертит тексты в кучу форматов.
Название: Plain text
Отправлено: Demetrius от декабря 25, 2011, 00:12
Цитата: Bhudh от декабря 24, 2011, 23:57
Проект Гутенберг конвертит тексты в кучу форматов.
Ну, не в такую уж и кучу. И это делается автоматически, и никакого дополнительного форматирования там нет.
Название: Plain text
Отправлено: Alone Coder от декабря 25, 2011, 00:21
У меня цитатник в plain text. Рад, что кто-то понимает.
Название: Plain text
Отправлено: vfaronov от декабря 25, 2011, 01:18
Списки без выравнивания левого края плохо читаемы, вложенные — бесполезны. А вложенные списки — один из лучших способов записи мыслей/заметок.

Выделенные заглавия, жирный текст облегчают восприятие записанного.

Гиперссылки помогают делить материал на части, не навязывая иерархии.
Название: Plain text
Отправлено: vfaronov от декабря 25, 2011, 01:22
Но разрозненные заметки я тоже в плейне пишу.
Название: Plain text
Отправлено: Bhudh от декабря 25, 2011, 01:30
Цитата: Alone Coder от У меня цитатник в plain text. Рад, что кто-то понимает.
Если б он ещё в уникоде был, было бы совсем радостно.
Название: Plain text
Отправлено: User Sapiens от декабря 25, 2011, 01:47
Текст это самое оно.

Никакой лишней информации, только сама информация. Проблема возникает только в случае передачи не текстовой информации, а другой информации (формулы, схемы и т. д.). Но это конечно не значит, что сам те 99% информации, которые являются простым текстом теперь надо искусственно увеличивать в размерах.

Сам стараюсь хранить всю информацию в текстовой форме. Это конечно не всегда удаётся, но благодаря юникоду можно достаточно много.
Название: Plain text
Отправлено: Dana от декабря 25, 2011, 03:43
Цитата: Demetrius от декабря 24, 2011, 23:53
Нет ничего лучше обычного текста.
-1.
Терпеть не могу plain text.
Его используют, в основном, олдфаги, застрявшие в 80-х.
Plain text морально устарел. Давно и окончательно.
Название: Plain text
Отправлено: Тайльнемер от декабря 25, 2011, 07:18
Цитата: Dana от декабря 25, 2011, 03:43
Терпеть не могу plain text.
Его используют, в основном, олдфаги, застрявшие в 80-х.
Plain text морально устарел. Давно и окончательно.

[tex]+\frac34[/tex]
Название: Plain text
Отправлено: Hellerick от декабря 25, 2011, 07:23
О чем я мечтаю...

О чем-то, что я называю wiki-офисом.

Желательно, чтобы его содержимое хранилось в Сети — чтобы я имел доступ к нему с любого своего компьютера. Доступ чтобы был прямой, по FTP. Или, может быть, чтобы хранилище было распределенным, чтобы для всякого объекта было три типа хранения: локальное, сетевое, или синхронизированное (при котором при котором каждый объект имеет локальную и сетевую копии обновляющиеся при подключении к сети).

Данные должны быть представлены в виде трех типов: wiki-страницы, медиа и база данных SQL.

Вики страницы — это папка с текстовыми файлами, в которых тупо написан вики-код.
Медиа — папка с картинками и т. п. Любой файл скинутый в папку становится автоматически доступным для вики.
В базе данных автоматически прописываются все файлы вики-офиса, а для страниц — и сравнения разных их версий, что обеспечивает возможность отката изменений.

Страницы можно редактировать любым текстовым редактором, но есть и встроенный, который позволяет просматривать текст и в режиме кода, и в «WYSIWIG» режиме. Есть возможность использования spread sheet, formula и прочих редакторов, которые создают в тексте страницы шаблоны содержащие данные, необходимые для рендеринга сложных wiki-объектов, и позволяющие редактировать их специализированными приложениями wiki-офиса. По красным ссылкам на медиа-объекты легко можно создавать необходимые векторные и растровые изображения с помощью встроенных редакторов.

Есть возможность создания коллекции CSS файлов, которые позволяют выбирать стиль отображения страниц — для браузинга, для чтения с экрана, для печати, для генерирования PDF  и т.п.

Разным группам пользователей можно открывать различный уровень доступа к своим файлам.

Есть приложения, позволяющие организацию блогов и форумов (хотя формально их страницы остаются текстовыми wiki-файлами, с сохранением всей их функциональности).

Все приложения вики-офиса доступны как из браузера, так и в устанавливаемом виде (более функциональном).
Название: Plain text
Отправлено: User Sapiens от декабря 25, 2011, 10:44
Цитата: Dana от декабря 25, 2011, 03:43
Цитата: Demetrius от декабря 24, 2011, 23:53
Нет ничего лучше обычного текста.
-1.
Терпеть не могу plain text.
Его используют, в основном, олдфаги, застрявшие в 80-х.
Plain text морально устарел. Давно и окончательно.
Да да,
К примеру, этот (http://www.gutenberg.org/cache/epub/22367/pg22367.txt) текст просто неприятно читать, если он не весит на пару МБ больше...
И смыслу в нём станет как минимум на 146% больше после изменения формата...
Другой формат тут как раз и не нужен, всё и так понятно.

Цитата: Тайльнемер от декабря 25, 2011, 07:18
[tex]+\frac34[/tex]
-F(1)  ;-)
F(x)=∫(3/4)dx; F(0)=0.
Не для всего нужен TeX. Иногда можно и простым текстом обойтись (для любителей лиц в тексте есть даже такое ☺)

Простой текст ещё не значит полное отсутствие форматирования!
Разве кто-то мешает начать новую мысль с красной строки и вообще культурно оформить текст?
Также «простой текст» не отменяет других форматов, просто надо подходить к текстам с умом и видеть, когда он оправдан, а когда надо и о другом формате подумать.
Название: Plain text
Отправлено: Квас от декабря 25, 2011, 11:04
Цитата: User Sapiens от декабря 25, 2011, 10:44
Не для всего нужен TeX. Иногда можно и простым текстом обойтись (для любителей лиц в тексте есть даже такое ☺)

Естественно!

За ТеХом всегда стоит вёрстка, то есть внешний вид. Несмотря на установку «человек вводит текст, компьютер делает остальное», всё равно приходится сверяться с аутпутом, бороться с оверфуллами, вставлять разрывы страниц, а в особо тяжёлых случаях — устранять висячие сроки.

Если надо распечатать и читать, то нужен ТеХ (хороший дизайн добавляет в жизнь красоты). Если не надо распечатывать, то ТеХ не нужен, потому что как язык разметки он неудобен. Команда типа \emph напрочь убивает читаемость предложения, что уж говорить о тексте, насыщенном командами?

Цитата: User Sapiens от декабря 25, 2011, 10:44
Простой текст ещё не значит полное отсутствие форматирования!

Боян бояном, но я нагуглил совсем недавно:
(wiki/en) Lightweight_markup_language (http://en.wikipedia.org/wiki/Lightweight_markup_language)
Я теперь любитель Markdown-а. :) Ещё документация к vim-у произвела впечатление своей художественностью.

Цитата: Dana от декабря 25, 2011, 03:43
Plain text морально устарел. Давно и окончательно.

И что пришло ему на смену? Офис? :D
Название: Plain text
Отправлено: Dana от декабря 25, 2011, 11:07
Цитата: Квас от декабря 25, 2011, 11:04
И что пришло ему на смену? Офис? :D
HTML и PDF ;)
Название: Plain text
Отправлено: Alone Coder от декабря 25, 2011, 11:14
Цитата: Dana от декабря 25, 2011, 11:07
PDF
Вы имеете в виду тот новодельный жирный полузакрытый формат, который поддерживают полторы глючных программы, который тормозит даже при прокрутке и который невозможно редактировать?
Название: Plain text
Отправлено: lehoslav от декабря 25, 2011, 11:57
Цитата: Квас от декабря 25, 2011, 11:04
Я теперь любитель Markdown-а.

Посмотрел. Понравилось :)
Название: Plain text
Отправлено: Demetrius от декабря 25, 2011, 12:33
Цитата: vfaronov от декабря 25, 2011, 01:18
Списки без выравнивания левого края плохо читаемы, вложенные — бесполезны.
Ну, есть всякие аутлайнеры, которые не только выравнивают по левому краю, но и свернуть дадут.

А с вложенными... Я лично разбиваю текст на строки. Ну, т.е. абзац у меня не одна большая строка, а много строк. Хотя у такого подхода тоже есть некоторые недостатки, но мне он нравится больше. А если кому не нравится, то переформатировать такой текст без проблем.

Цитата: vfaronov от декабря 25, 2011, 01:18
Выделенные заглавия, жирный текст облегчают восприятие записанного.
Никто не мешает использовать редакор, который выделяет **такой** текст жирным и т.д. Если очень хочется.

Цитата: vfaronov от декабря 25, 2011, 01:18
Гиперссылки помогают делить материал на части, не навязывая иерархии.
Я уже говорил, но повторюсь: мне очень понравилось, как сделаны эрзац-гиперссылки в Acme. Простой щелчок правой кнопкой мыши по названию файла открывает этот файл. Всё!

По сути, такой минимальной функции достаточно для гипертекста.

Цитата: Bhudh от декабря 25, 2011, 01:30
Цитата: Alone Coder от У меня цитатник в plain text. Рад, что кто-то понимает.
Если б он ещё в уникоде был, было бы совсем радостно.
Не уверен. Когда я смотрю на уникод, мне хочется что-то с ним сделать.

Сам-то я использую уникод, но уверен, что это далеко не лучший вариант.

Цитата: Dana от декабря 25, 2011, 03:43
Терпеть не могу plain text.
Его используют, в основном, олдфаги, застрявшие в 80-х.
Plain text морально устарел. Давно и окончательно.
Вы очень правильно сказали: морально устарел. Проблема не в том, что он плохой, а в том, как мы его воспринимаем.

Цитата: Hellerick от декабря 25, 2011, 07:23
О чем я мечтаю...

О чем-то, что я называю wiki-офисом.
Вроде бы всё, что Вы описали, не так уж и сложно сделать.

Сложнее будет в локальной версии сделать контроль версий. Либо а) при локальной работе надо не просто открывать файл в редакторе, но и после этого запускать программу, которая запишет изменения, либо б) надо открывать файлы только в спец. редакторе, который записывает изменения, в) надо постоянно держать запущенным демон, который следит за именениями файлов.

Цитата: Квас от декабря 25, 2011, 11:04
Боян бояном, но я нагуглил совсем недавно:
(wiki/en) Lightweight_markup_language (http://en.wikipedia.org/wiki/Lightweight_markup_language)
Я теперь любитель Markdown-а. :) Ещё документация к vim-у произвела впечатление своей художественностью.
А я втихаря пишу свой формат.
Spoiler: Если кому интересно ⇓⇓⇓

Цитата: Alone Coder от декабря 25, 2011, 11:14
Цитата: Dana от декабря 25, 2011, 11:07
PDF
Вы имеете в виду тот новодельный жирный полузакрытый формат, который поддерживают полторы глючных программы, который тормозит даже при прокрутке и который невозможно редактировать?
Ну, на самом деле SumatraPDF очень неплоха. То, что невозможно редактировать—это фича; PDF, по сути,—замена для большой кучи картинок, а не для текста. Вот самое большое зло PDF: то, что автор может запретить копировать из файла текст, печатать файл и т.д.

Цитата: Dana от декабря 25, 2011, 11:07
HTML и PDF ;)
HTML слишком жирный. Для его отображения нужен целый браузер, а это одни из самых прожорливых к ресурсам программ.
Название: Plain text
Отправлено: Hellerick от декабря 25, 2011, 12:54
Цитата: Demetrius от декабря 25, 2011, 12:33
А я втихаря пишу свой формат.

Я тоже писал. «CTF» назывался (сonventional text format).

Но сейчас я против выдумывания стандартов. Есть очень авторитетный синтаксис медиавики, и я считаю, что следует держаться его. Польза от его оптимизации не может превысить вреда от нестандартности.

А вообще, интересно подумать, что было бы, если бы HTML так и не появился, а вместо него с самого начала развивались light-weight форматы.
Название: Plain text
Отправлено: Квас от декабря 25, 2011, 13:09
Цитата: Dana от декабря 25, 2011, 11:07
Цитата: Квас от декабря 25, 2011, 11:04И что пришло ему на смену? Офис? :D
HTML и PDF ;)

Слава богу, что не Офис. :)

Сравнивать PDF и текст некорректно. PDF есть некий способ сохранения внешнего вида документа, при этом сам файл создаётся специфическими приложениями, которые непосредственно к формату PDF отношения не имеют. PDF — одна из форм output-а. Текстовый PDF-документ можно сделать в Блокноте, в Вёрде или в ТеХе, с совершенно разным итогом.

Сам по себе HTML нечитаем, нужен браузер. Да и писать HTML, наверно, не слишком удобно. HTML прочно ассоциируется с вебом. Почему именно его стоит использовать в качестве универсального формата?
Название: Plain text
Отправлено: Квас от декабря 25, 2011, 13:10
Цитата: Hellerick от декабря 25, 2011, 12:54
Есть очень авторитетный синтаксис медиавики, и я считаю, что следует держаться его.

А почему? Мы говорим «медиавики», подразумеваем «википедия»? Кроме wiki-сайтов эта разметка где-то используется?
Название: Plain text
Отправлено: Bhudh от декабря 25, 2011, 13:11
Цитата: Demetrius от
Spoiler: Если кому интересно ⇓⇓⇓
Весьма напоминает разметку в TiddlyWiki.

Цитата: Demetrius от декабря 25, 2011, 12:33HTML слишком жирный. Для его отображения нужен целый браузер
Целый браузер нужен для скриптов и стилей. Для чистого HTML всё это не нужно.
Название: Plain text
Отправлено: Demetrius от декабря 25, 2011, 13:11
Цитата: Hellerick от декабря 25, 2011, 12:54
Но сейчас я против выдумывания стандартов. Есть очень авторитетный синтаксис медиавики, и я считаю, что следует держаться его. Польза от его оптимизации не может превысить вреда от нестандартности.
Синтаксис МедиаВики—это отвратительно. Он а) сложен для обработки, б) неинтуитивен, в) сложен для использования с русским текстом (нужно лепить раскладку с апострофами).

Да и вообще, никакой он не стандарт. Где он используется, кроме как в МедиаВики? По-моему нигде.

Если я и соглашусь на какой-то существующий формат, то разве что на Креоль (http://en.wikipedia.org/wiki/Creole_%28markup%29). Хотя мне и в нём многое не нравится.
Название: Plain text
Отправлено: Demetrius от декабря 25, 2011, 13:17
Цитата: Квас от декабря 25, 2011, 13:10
А почему? Мы говорим «медиавики», подразумеваем «википедия»? Кроме wiki-сайтов эта разметка где-то используется?
Даже на вики-сайтах далеко не на всех.

Цитата: Квас от декабря 25, 2011, 13:09
Сам по себе HTML нечитаем, нужен браузер. Да и писать HTML, наверно, не слишком удобно. HTML прочно ассоциируется с вебом. Почему именно его стоит использовать в качестве универсального формата?
Писать его нормально, я часто так делаю. А используется он в качестве универсального формата по той простой причине, что программы для его чтения есть везде.

Цитата: Bhudh от декабря 25, 2011, 13:11
Весьма напоминает разметку в TiddlyWiki.
А у них тоже абзацы с красной строки?

Цитата: Bhudh от декабря 25, 2011, 13:11
Цитата: Demetrius от декабря 25, 2011, 12:33HTML слишком жирный. Для его отображения нужен целый браузер
Целый браузер нужен для скриптов и стилей. Для чистого HTML всё это не нужно.
Чистый HTML без стилей? Где найти легковесные программы для отображения такого чуда?
Название: Plain text
Отправлено: Python от декабря 25, 2011, 13:22
Цитата: Квас от декабря 25, 2011, 13:09
Сам по себе HTML нечитаем, нужен браузер. Да и писать HTML, наверно, не слишком удобно.
Зависит от того, насколько он загажен стилями, скриптами и семантической лабудой. В простейшем случае, html пишется/читается не намного сложнее, чем bbcode (язык разметки, используемый для сообщений на форумах).
Название: Plain text
Отправлено: Hellerick от декабря 25, 2011, 13:22
Цитата: Demetrius от декабря 25, 2011, 13:11
(нужно лепить раскладку с апострофами).

А как вы в своем формате «>» набираете?

От медиавики просто уже невозможно отказаться. Википедия, может быть, написана на века, и ее код будут править в марсианских колониях.

А раз медиавики, в отличие от всего остального, не исчезнет, то проще всё что только можно свести к нему.

Что касается красной строки, то я стараюсь от нее избавиться — также как и от десятичной запятой. Национальный стандарт, от которого слишком много мороки, чтобы продолжать его придерживатсья.
Название: Plain text
Отправлено: Bhudh от декабря 25, 2011, 13:24
Цитата: Demetrius от А у них тоже абзацы с красной строки?
Вот только до этого не додумались. Там, кстати, и есть Креоль.
Ты помнишь, что пробелы в начале строки в МедиаВики значат?

Цитата: Demetrius от Чистый HTML без стилей? Где найти легковесные программы для отображения такого чуда?
Да даже со стилями. Wisiwig-проги без скриптов, но с предпросмотром больше браузеров весят, что ли?
Название: Plain text
Отправлено: Python от декабря 25, 2011, 13:26
Цитата: Demetrius от декабря 25, 2011, 13:17
Чистый HTML без стилей? Где найти легковесные программы для отображения такого чуда?
Lynx/Links/еще какой-то браузер для текстового терминала?..
Название: Plain text
Отправлено: Python от декабря 25, 2011, 13:30
Кстати, в Опере можно отключать отображение стилей (т. н. «пользовательский режим» вместо «авторского»). Конечно, это не самая легковесная программа, и html без стилей часто выглядит довольно уродски, но некоторые страницы, со стилями вешающие браузер минут на пять, с отключенными стилями грузятся сравнительно мгновенно.
Название: Plain text
Отправлено: Квас от декабря 25, 2011, 13:32
Цитата: Demetrius от декабря 25, 2011, 13:17
Цитата: Квас от декабря 25, 2011, 13:09Сам по себе HTML нечитаем, нужен браузер. Да и писать HTML, наверно, не слишком удобно. HTML прочно ассоциируется с вебом. Почему именно его стоит использовать в качестве универсального формата?
Писать его нормально, я часто так делаю. А используется он в качестве универсального формата по той простой причине, что программы для его чтения есть везде.

Мне кажется, что <em></em> убивает читаемость не меньше, чем \emph{}. Текст с тегами — фе.

«Универсальный формат» я имел в виду несколько в другом смысле: например, сюда относятся повседневное использование или текстовая справка к программам. С тегами связываться никакого желания. Поэтому я и выступаю за лёгкую разметку (возможно, самодельную) плюс конвертеры (возможно, самодельные). Кстати, ваша разметка весьма симпатична. :yes:
Название: Plain text
Отправлено: Bhudh от декабря 25, 2011, 13:32
Цитата: Python от некоторые страницы, со стилями вешающие браузер минут на пять, с отключенными стилями грузятся сравнительно мгновенно.
Значит, просто стили (или тэги) прописаны криво, и браузер тщетно пытается определить, какой куда совать.
Название: Plain text
Отправлено: Квас от декабря 25, 2011, 13:34
Цитата: Python от декабря 25, 2011, 13:22
Цитата: Квас от декабря 25, 2011, 13:09Сам по себе HTML нечитаем, нужен браузер. Да и писать HTML, наверно, не слишком удобно.
Зависит от того, насколько он загажен стилями, скриптами и семантической лабудой. В простейшем случае, html пишется/читается не намного сложнее, чем bbcode (язык разметки, используемый для сообщений на форумах).

bbcode я тоже не хочу читать. Привередлив-с. :)
Название: Plain text
Отправлено: Python от декабря 25, 2011, 13:43
ЦитироватьМне кажется, что <em></em> убивает читаемость не меньше, чем \emph{}. Текст с тегами — фе.
Однобуквенные (<b>, <i>, <u>, <s>) еще как-то можно терпеть. html начал портиться, когда пошла мода менять их на «семантические», хотя в чем практическое отличие <strong> от <b>, сказать сложно. Еще хуже, когда вместо них используется <span> с кучей параметров, когда за раздутой «разметкой» не видно самого текста.
Название: Plain text
Отправлено: Demetrius от декабря 25, 2011, 13:50
Цитата: Hellerick от декабря 25, 2011, 13:22
А как вы в своем формате «>» набираете?
У меня формат пока что не устоялся. Вместо | как знака продолжения блока можно использовать :. Вместо (или вместе с?) > тоже будет какой-нибудь знак. Может, ), пока что не знаю.

Цитата: Hellerick от декабря 25, 2011, 13:22
От медиавики просто уже невозможно отказаться. Википедия, может быть, написана на века, и ее код будут править в марсианских колониях.

А раз медиавики, в отличие от всего остального, не исчезнет, то проще всё что только можно свести к нему.
С чего Вы взяли, что они будут делать это именно на языке разметки МедиаВики? Что помешает в марсианских колониях перевести Википедию в другой формат?

Цитата: Hellerick от декабря 25, 2011, 13:22
Что касается красной строки, то я стараюсь от нее избавиться — также как и от десятичной запятой. Национальный стандарт, от которого слишком много мороки, чтобы продолжать его придерживатсья.
В том-то и дело, что мне её не хватало в английских текстах. В русских-то всё понятно: каждый абзац с красной строки. А в английских бывают абзацы с красной строкой, а бывают без (после заголовков и пустых строк). И Маркдаун это различие передать не даёт.

Цитата: Bhudh от декабря 25, 2011, 13:24
Цитата: Demetrius от А у них тоже абзацы с красной строки?
Вот только до этого не додумались. Там, кстати, и есть Креоль.
Ты помнишь, что пробелы в начале строки в МедиаВики значат?
А какая разница, что они значат в МедиаВики? В МедиаВики очень запутанный и нелогичный синтаксис. Зачем его копировать?

Цитата: Bhudh от декабря 25, 2011, 13:24
Да даже со стилями. Wisiwig-проги без скриптов, но с предпросмотром больше браузеров весят, что ли?
Они используют движок IE же. Который о-о-оч-чень тяжеловесный.

Цитата: Python от декабря 25, 2011, 13:26
Lynx/Links/еще какой-то браузер для текстового терминала?..
А чем это лучше плейн текста? :what:

Доречі, на синтаѯис блоків в моєму форматі достатньо сильно повпливалав ваш формат даних (той, який «Дерево замість ѮМЛ»). Принаймні звідти я взяв ідею, що повинні бути окремі символи для початку блоку і для продовження (у Вас це > і *, у мене для блоків це М+ і М|, де M&mdash;мітка типу блоку). Правда, я ще добавив можливість починати рядок зі знаку продовження блоку, якщо це не створює двозначності.
Название: Plain text
Отправлено: Bhudh от декабря 25, 2011, 13:57
Цитата: Demetrius от Они используют движок IE же.
Даже Линуховые⁈ :o
Название: Plain text
Отправлено: Demetrius от декабря 25, 2011, 14:02
Цитата: Квас от декабря 25, 2011, 13:32
Поэтому я и выступаю за лёгкую разметку (возможно, самодельную) плюс конвертеры (возможно, самодельные).
IMHO тут выбор между тяжеловесностью и самодельностью. Легковесная программа заведомо будет делать не всё; и её заведомо надо будет адаптировать к другим требованиям

Из более-менее тяжеловесных, но читаемых, есть AsciiDoc и reStructuredText. В них, в принципе, есть всё, что надо в большинстве случаев. Но хочется чего-то попроще.

Я вот поэтому хочу, чтобы в моём конверторе новые блоки можно было добавлять и менять простым редактированием одной структуры в файле.

Цитата: Квас от декабря 25, 2011, 13:32Кстати, ваша разметка весьма симпатична. :yes:
:-[
Я её ещё доведу до ума, а потом обнародую. Пока что у меня нет внутритекстового форматирования. Точнее, оно недописано. Думаю сделать //такой// курсив и **такой** полужирный. Ну, и ещё со ссылками не определился.

Цитата: Python от декабря 25, 2011, 13:43
html начал портиться, когда пошла мода менять их на «семантические», хотя в чем практическое отличие <strong> от <b>, сказать сложно. Еще хуже, когда вместо них используется <span> с кучей параметров, когда за раздутой «разметкой» не видно самого текста.
IMHO идея не плодить новых версий HTML и переводить всех на XML была очень здравой. Но создался WHATWG, и там стали клепать этот уродливый HTML5. :'(

Цитата: Bhudh от декабря 25, 2011, 13:57
Цитата: Demetrius от Они используют движок IE же.
Даже Линуховые⁈ :o
Линуксовые тоже используют какой-нибудь готовый движок, типа Gecko/WebKit/KHTML/&c.
Название: Plain text
Отправлено: Demetrius от декабря 25, 2011, 14:14
Кстати, Hellerick, покажите свой формат, пожалуйста!
Название: Plain text
Отправлено: Hellerick от декабря 25, 2011, 14:23
Цитата: Demetrius от декабря 25, 2011, 14:14
Кстати, Hellerick, покажите свой формат, пожалуйста!

Ой, это было так давно, что, теперь едва ли что-то можно найти.

Но там были красные строки и даже знаки переноса (дефис считался мягким, если сразу после него шел перенос строки; чтобы этого избежать, между дефисом и переносом строки ставился пробел).

Пока я читал эту дискуссию, я кое-что кропал в блокнотике:


Но для обычной русской раскладки это, конечно, не подходит. Разве что попробовать заменить фигурные скобки обычными.
Название: Plain text
Отправлено: Demetrius от декабря 25, 2011, 14:33
Иметь общий набор спецсимволов для кодов (как {} у Вас и <> в XML), безусловно, элегантно и удобно, но, по моему скромному мнению, текст с такой разметкой не очень подходит для чтения в «сыром» виде. Хотя да, безусловно, идея очень симпатичная.
Название: Plain text
Отправлено: Bhudh от декабря 25, 2011, 14:38
Цитата: Demetrius от IMHO идея не плодить новых версий HTML и переводить всех на XML была очень здравой.
И все бы попёрли выдумывать новые тэги.
А теперь представь ужас на дисплее, когда файл xml загрузился, а dtd где-то подвис...


Цитата: Hellerick от
Не выдерживаю и даю-таки Креольскую тиддли-разметку:''полужирный''
//курсивный//
''//полужирный курсив//''
__подчёркнутый__
--зачёркнутый--
^^над^^строчный
~~под~~строчный
@@подсвеченный@@
{{{моноширинный}}}

Не будем изобретать велосипедов, г-да!
Название: Plain text
Отправлено: Hellerick от декабря 25, 2011, 14:52
Разумеется, что-то новое здесь придумать сложно. Кругом изобретатели велосипедов.

Попарвляюсь насчет оформления ссылок. Интуитивнее сначала писать текст, и только потом адрес. Например так:

Why don't you ask {here >google.com<}?
Название: txt
Отправлено: Dana от декабря 25, 2011, 15:53
Бесят книги в формате DOC, RTF и TXT. Ну это изврат просто...
Русские особенно такой садомазохизм любят, на Западе такое реже встречается. Олдфаги-хардкорщики, блин.
Есть же человеческий PDF.
Название: txt
Отправлено: Hellerick от декабря 25, 2011, 15:57
Цитата: Dana от декабря 25, 2011, 15:53
Есть же человеческий PDF.

Бесит.

Воспринимаю PDF как недораспознанный формат.

Полфабрикат, над которым еще нужно попотеть, чтобы преобразовать его во что-нибудь юзабельное.
Название: txt
Отправлено: I. G. от декабря 25, 2011, 15:58
Цитата: Dana от декабря 25, 2011, 15:53
Бесят книги в формате DOC, RTF и TXT. Ну это изврат просто...
Они прекрасно идут в читалках! Правда, если вычитаны хорошо.
Название: txt
Отправлено: Dana от декабря 25, 2011, 16:02
Цитата: Hellerick от декабря 25, 2011, 15:57
Воспринимаю PDF как недораспознанный формат.

Полфабрикат, над которым еще нужно попотеть, чтобы преобразовать его во что-нибудь юзабельное.
В смысле?
А чего там не хватает?

Цитата: I. G. от декабря 25, 2011, 15:58
Они прекрасно идут в читалках!
В каких?

Цитата: I. G. от декабря 25, 2011, 15:58
Правда, если вычитаны хорошо.
Ото ж.
Название: txt
Отправлено: I. G. от декабря 25, 2011, 16:03
Цитата: Dana от декабря 25, 2011, 16:02
Цитата: I. G. от декабря 25, 2011, 15:58Они прекрасно идут в читалках!
В каких?
Покетбук какой-то у меня. По вечерам читываю.  ::)
Название: txt
Отправлено: Тайльнемер от декабря 25, 2011, 16:15
Цитата: Dana от декабря 25, 2011, 15:53
Бесят книги в формате DOC, RTF и TXT. Ну это изврат просто...
Русские особенно такой садомазохизм любят, на Западе такое реже встречается. Олдфаги-хардкорщики, блин.
Есть же человеческий PDF.
−1

PDF — эмулятор бумаги. Электронная книга не должна ориентироваться на своего бумажного предка.

Цитата: Dana от декабря 25, 2011, 16:02
А чего там не хватает?
Выбора размера шрифта, количества и ширины колонок, разбиения или не разбиения на страницы; возможности редактирования текста и т. п.
Название: txt
Отправлено: Alone Coder от декабря 25, 2011, 17:03
Цитата: Dana от декабря 25, 2011, 15:53
Есть же человеческий PDF.
Цитата: Alone Coder от декабря 25, 2011, 11:14
Вы имеете в виду тот новодельный жирный полузакрытый формат, который поддерживают полторы глючных программы, который тормозит даже при прокрутке и который невозможно редактировать?
Название: txt
Отправлено: Oleg Grom от декабря 25, 2011, 17:04
Только djvu со слоем распознанного текста православен. Вычитанный и заново сверстанный pdf - это конечно хорошо, но уж больно геморойно, особенно учитывая нынешние масштабы оцифровки всего и вся.
Название: txt
Отправлено: Demetrius от декабря 25, 2011, 17:30
Цитата: Dana от декабря 25, 2011, 15:53
Бесят книги в формате DOC, RTF и TXT. Ну это изврат просто...
Русские особенно такой садомазохизм любят, на Западе такое реже встречается. Олдфаги-хардкорщики, блин.
Есть же человеческий PDF.
-много

Книги в TXT православнее всего.

Кстати, часто нарываюсь на китайские книги именно в формате TXT. Это радует.
Название: Plain text
Отправлено: Demetrius от декабря 25, 2011, 17:36
Цитата: Bhudh от декабря 25, 2011, 14:38
Цитата: Demetrius от IMHO идея не плодить новых версий HTML и переводить всех на XML была очень здравой.
И все бы попёрли выдумывать новые тэги.
Так это же замечательно.

Цитата: Bhudh от декабря 25, 2011, 14:38А теперь представь ужас на дисплее, когда файл xml загрузился, а dtd где-то подвис...
Там будет не ужас, а вполне себе красивое деревце. Да и ситуация гипотетическая, у Вас часто CSS «где-то подвисает»?

Цитата: Bhudh от декабря 25, 2011, 14:38Не выдерживаю и даю-таки Креольскую тиддли-разметку:''полужирный''
//курсивный//
''//полужирный курсив//''
__подчёркнутый__
--зачёркнутый--
^^над^^строчный
~~под~~строчный
@@подсвеченный@@
{{{моноширинный}}}

Не будем изобретать велосипедов, г-да!
Это нифига не креоль. В креоле **полужирный**. См. креольную шпаргалку (http://www.wikicreole.org/attach/CheatSheet/creole_cheat_sheet_german.html).
Название: Plain text
Отправлено: Hellerick от декабря 25, 2011, 17:46
А что такое «@@подсвеченный@@»?
Название: txt
Отправлено: Joris от декабря 25, 2011, 17:51
все должно быть в djvu
Название: txt
Отправлено: Hellerick от декабря 25, 2011, 17:55
По-моему, вы сейчас о разных вещах говорите.
Название: Plain text
Отправлено: Demetrius от декабря 25, 2011, 18:14
У которого фон другого цвета, видимо. :donno:
Название: txt
Отправлено: Dana от декабря 25, 2011, 19:37
Цитата: Тайльнемер от декабря 25, 2011, 16:15
Выбора размера шрифта, количества и ширины колонок, разбиения или не разбиения на страницы; возможности редактирования текста и т. п.
Ну мне этого и не нужно в отформатированной книге. Меня устраивает эмулятор бумаги.
Хорошо отформатированный текст мне легче усваивать.
Название: Plain text
Отправлено: Bhudh от декабря 25, 2011, 22:53
Цитата: Demetrius от Там будет не ужас, а вполне себе красивое деревце. Да и ситуация гипотетическая, у Вас часто CSS «где-то подвисает»?
Может, и не часто, но сама возможность есть.
И потом, «деревце» — это дополнительный парсинг. Вдруг файл обфускованный?
Название: Plain text
Отправлено: Bhudh от декабря 25, 2011, 22:54
Цитата: Hellerick от декабря 25, 2011, 17:46
А что такое «@@подсвеченный@@»?
Цитата: Demetrius от декабря 25, 2011, 18:14У которого фон другого цвета, видимо.
По дефолту — жёлтого.
Название: Plain text
Отправлено: Квас от декабря 25, 2011, 23:00
Цитата: Demetrius от декабря 25, 2011, 14:02
Легковесная программа заведомо будет делать не всё; и её заведомо надо будет адаптировать к другим требованиям

Поразмыслил.

И тяжеловесная делает не всё. HTML не делает того, что делает [tex]\mbox{\TeX}[/tex], и обратно. Нельзя объять необъятное. Легковесная разметка — некий каркас, который удобно и сам по себе использовать, и (теоретически) конвертировать. А после конвертации можно и шлифовать.
Название: Plain text
Отправлено: User Sapiens от декабря 25, 2011, 23:40
Цитата: Python от декабря 25, 2011, 13:26
Цитата: Demetrius от декабря 25, 2011, 13:17
Чистый HTML без стилей? Где найти легковесные программы для отображения такого чуда?
Lynx/Links/еще какой-то браузер для текстового терминала?..
elinks, links2, w3m и думаю есть ещё несколько.
Я пользуюсь elinks и w3m. Ими пользоваться конечно можно и даже неплохо, но большинство страниц не рассчитаны на такое и не всегда отображаются хорошо, но с этим ничего не поделать.
Ещё вариант, который я также использую, это броузер где почти всё отключено. Он конечно весит побольше чем терминальные броузеры, но загружает всё быстрее, чем стандартные без специфических настроек.
Название: Plain text
Отправлено: Demetrius от декабря 26, 2011, 00:10
Цитата: Bhudh от декабря 25, 2011, 22:53
И потом, «деревце» — это дополнительный парсинг. Вдруг файл обфускованный?
Обфускация затрудняет понимание для человека. А компьютеру всё равно.

А парсинг по любому выполняется. Браузер по любому строит DOM, который как раз это самое дерево и есть.
Название: Plain text
Отправлено: Bhudh от декабря 26, 2011, 00:13
Да знаю.
Spoiler: Dragonfly DOM ⇓⇓⇓
Название: txt
Отправлено: sasza от декабря 26, 2011, 00:52
Цитата: Dana от декабря 25, 2011, 19:37
Ну мне этого и не нужно в отформатированной книге. Меня устраивает эмулятор бумаги.
Хорошо отформатированный текст мне легче усваивать.
Когда у вас появится ебук, резко разлюбите нормальные форматы и полюбите ненормальные.
Название: Plain text
Отправлено: arseniiv от декабря 26, 2011, 12:58
(Меня вернули мыслями к формату словарей (с языка на язык которые). Надо бы тему создать, а то я с ним без помощи не разберусь...)
Название: Plain text
Отправлено: arseniiv от декабря 26, 2011, 14:22
Вот она: Словарь лингвофорумчанина (http://lingvoforum.net/index.php/topic,42754.0.html).
А то с левой панели быстро уезжает, а так хоть кто-нибудь заметит... :???

Прости, Deme., за оффтопье.
Название: txt
Отправлено: Hellerick от декабря 26, 2011, 14:27
Я сейчас одновременно смотрю мультяшку, редактирую текстовой файл и читаю PDF, так что мне и экрана ноутбука не хватает для комфортного просмотра PDF. Приходится между зумом и скроллом искать меньшее зло.
Название: txt
Отправлено: Python от декабря 26, 2011, 18:07
Цитата: Dana от декабря 25, 2011, 15:53
Бесят книги в формате DOC, RTF и TXT. Ну это изврат просто...
Русские особенно такой садомазохизм любят, на Западе такое реже встречается. Олдфаги-хардкорщики, блин.
Есть же человеческий PDF.
DOC и RTF — да, изврат. TXT хорош тем, что нетребователен к ресурсам. Кому не нравится плейн-текст — в чем проблема переделать его в простейший html, добавив <pre> сверху и </pre> снизу? При необходимости, также можно прицепить заголовок с указанием кодировки.
Название: txt
Отправлено: arseniiv от декабря 26, 2011, 18:10
А мне, кстати, не нравится текст, претендующий на плэйновость, но являющийся текстом с переводами строки и удвоением-учетверением пробелов дабы стать похожим на выровненный по ширине. По той ширине, которая тебе не нравится, и с такими же пробельными фокусами. Именно, его нельзя сконвертировать во что-нибудь нормальное быстро и без мучений.
Название: txt
Отправлено: sasza от декабря 26, 2011, 18:27
Цитата: arseniiv от декабря 26, 2011, 18:10
Именно, его нельзя сконвертировать во что-нибудь нормальное быстро и без мучений.
Если в нём нет "таблиц", то нет ничего проще - меняем двойной перевод строки на <p>, расширение на .html, и готово!
Название: txt
Отправлено: arseniiv от декабря 26, 2011, 18:40
А как вы справитесь с изредка встречающимися немягкими переносами-дефисами?
Название: txt
Отправлено: sasza от декабря 26, 2011, 22:06
Так же, как и с опечатками в обычной книге - путём их игнорирования :-)
Название: txt
Отправлено: Python от декабря 26, 2011, 22:55
Если невозможно определить, перенос это или дефис, можно поставить после него <br> на всякий случай.
Название: txt
Отправлено: mnashe от декабря 26, 2011, 23:11
Цитата: Тайльнемер от декабря 25, 2011, 16:15
PDF — эмулятор бумаги. Электронная книга не должна ориентироваться на своего бумажного предка.
:+1:

Цитата: Тайльнемер от декабря 25, 2011, 16:15
Цитата: Dana от декабря 25, 2011, 16:02
А чего там не хватает?
Выбора размера шрифта, количества и ширины колонок, разбиения или не разбиения на страницы; возможности редактирования текста и т. п.
:+1:
Название: txt
Отправлено: mnashe от декабря 26, 2011, 23:35
Цитата: arseniiv от декабря 26, 2011, 18:10
Именно, его нельзя сконвертировать во что-нибудь нормальное быстро и без мучений.
Легко, одним махом.
Правда, работал я над этим конвертером довольно долго. Больше тысячи строк скриптового языка, не говоря уже об используемых им функциях редактора, написанных на ассемблере.

Цитата: sasza от декабря 26, 2011, 18:27
Если в нём нет "таблиц", то нет ничего проще - меняем двойной перевод строки на <p>, расширение на .html, и готово!
И с таблицами, как правило, он справляется легко, если эти таблицы оформлены как следует. Если нет — подрисовываем сначала каждую таблицу как положено (это очень быстро: стрелочками передвигаем курсор, Shift-стрелочками рисуем, есть также клавиши для расширения и разделения строк и столбцов).

Цитата: arseniiv от декабря 26, 2011, 18:40
А как вы справитесь с изредка встречающимися немягкими переносами-дефисами?
А вот это уже сложнее. Тут словарь нужен.
Мне не так часто приходилось конвертировать тексты с переносами, так что я ограничился запросом на каждый дефис-или-перенос с запоминанием выбора (на один сеанс).

Прилагаю исходник, если интересно.
Сам редактор со всеми фичами я уже как-то выкладывал.
Название: +
Отправлено: Oleg Grom от декабря 26, 2011, 23:44
Цитата: Тайльнемер от декабря 25, 2011, 16:15
PDF — эмулятор бумаги. Электронная книга не должна ориентироваться на своего бумажного предка.
Если книга изначально создавалась как электронная, то на здоровье, извращайтесь как хотите. Но если это копия бумажной книги, то она должна быть как можно более точной копией, не месивом из текста.
Название: +
Отправлено: Dana от декабря 26, 2011, 23:46
Цитата: Oleg Grom от декабря 26, 2011, 23:44
Но если это копия бумажной книги, то она должна быть как можно более точной копией, не месивом из текста.
:+1:
Название: +
Отправлено: Python от декабря 26, 2011, 23:53
ЦитироватьЭлектронная книга не должна ориентироваться на своего бумажного предка.
Теоретически, можно согласиться. Практически — годных чисто электронных стандартов с графическими возможностями pdf я пока не видел. html слишком сырой и слишком нестабильный, кроме того, несколько мешает многофайловость html — для книжки, хранимой на локальном диске, это скорее минус. Да, и что там с подгружаемыми шрифтами — общепринятый стандарт существует, или только в далеком будущем?..

А вообще, «бумажность» pdf — в чем-то даже преимущество. Мне лично удобнее формат, где длинное полотно текста разбито на страничные порции с запоминаемыми номерами. Сплошной html неудобен своей неструктурированностью. html в виде кучи маленьких файликов неудобен тем, что их нельзя быстро пролистывать. К тому же, преимущество html в виде «резинового» форматирования зачастую теряется из-за слишком большой свободы и криворукости дизайнеров, которым ничего не стоит сделать фиксированную ширину блока текста, ориентируясь на монитор в два раза шире моего.
Название: +
Отправлено: Bhudh от декабря 26, 2011, 23:56
Цитата: Python от Да, и что там с подгружаемыми шрифтами — общепринятый стандарт существует, или только в далеком будущем?..
Разве @font-face поддерживают ещё не все?‥
Название: +
Отправлено: Python от декабря 26, 2011, 23:58
Цитата: Bhudh от декабря 26, 2011, 23:56
Цитата: Python от Да, и что там с подгружаемыми шрифтами — общепринятый стандарт существует, или только в далеком будущем?..
Разве @font-face поддерживают ещё не все?‥
Помнится, еще недавно была ситуация «все, да по-разному».
Название: Plain text
Отправлено: mnashe от декабря 27, 2011, 00:01
Цитата: Alone Coder от декабря 25, 2011, 00:21
У меня цитатник в plain text. Рад, что кто-то понимает.
Я тоже всю информацию сохраняю в plain text. Если там много разметки — конвертирую затем в HTML и там дорабатываю.

Цитата: vfaronov от декабря 25, 2011, 01:18
Списки без выравнивания левого края плохо читаемы, вложенные — бесполезны. А вложенные списки — один из лучших способов записи мыслей/заметок.
В моём редакторе есть фича, позволяющая скрывать строки с отступом больше выбранного. Создавалась изначально (не мной) для языков программирования, но и тут может быть полезна.

Цитата: vfaronov от декабря 25, 2011, 01:18
Выделенные заглавия, жирный текст облегчают восприятие записанного.
Мой редактор автоматически выделяет заглавия.
Заглавия помечены строкой символов (по умолчанию — один символ LF, т.е. ASCII 12).
Кроме выделения, это и отметка для конвертера, определяющая строку как <H2>...<H6> (в зависимости от отступа между символом заголовка и самим заголовком).
С жирным шрифтом хуже. Я помечаю ◄так►, конвертер понимает и переводит <b>так</b>. Но цветом редактор это не выделяет.

Цитата: vfaronov от декабря 25, 2011, 01:22
Но разрозненные заметки я тоже в плейне пишу.
:+1:

Цитата: User Sapiens от декабря 25, 2011, 01:47
Сам стараюсь хранить всю информацию в текстовой форме.
:+1:
Название: Plain text
Отправлено: mnashe от декабря 27, 2011, 00:04
Цитата: Python от декабря 25, 2011, 13:43
ЦитироватьМне кажется, что <em></em> убивает читаемость не меньше, чем \emph{}. Текст с тегами — фе.
Однобуквенные (<b>, <i>, <u>, <s>) еще как-то можно терпеть. html начал портиться, когда пошла мода менять их на «семантические», хотя в чем практическое отличие <strong> от <b>, сказать сложно. Еще хуже, когда вместо них используется <span> с кучей параметров, когда за раздутой «разметкой» не видно самого текста.
:+1:
Всегда перевожу такое.
strong→b и em→i вручную, а для избавления от span используется одна из фичей моего довольно мощного HTML-оптимизатора.
Название: +
Отправлено: Bhudh от декабря 27, 2011, 00:06
Ну как по-разному...
Каждому браузеру вписывается шрифт в поддерживаевом им формате, а так-то правило для всех единое.
Название: Plain text
Отправлено: Квас от декабря 27, 2011, 00:19
Цитата: Тайльнемер от декабря 25, 2011, 16:15
Электронная книга не должна ориентироваться на своего бумажного предка.

А я думаю — должна. Есть такая штука — дизайн. Со времён Гутенберга придумали много мелочей, которые не бросаются в глаза, но делают чтение комфортным.
Название: Plain text
Отправлено: mnashe от декабря 27, 2011, 01:26
Два примера работы моего конвертера. Один — с заголовками, второй — с таблицами.
Исходный текст, результат в HTML, screenshot текста, screenshot режима «только заголовки».
Название: Plain text
Отправлено: Alone Coder от декабря 27, 2011, 07:40
Цитата: Oleg Grom от декабря 26, 2011, 23:44
Но если это копия бумажной книги, то она должна быть как можно более точной копией, не месивом из текста.
Значит, она должна быть в стандартном формате djvu.
Название: Plain text
Отправлено: Oleg Grom от декабря 27, 2011, 08:24
Цитата: Alone Coder от декабря 27, 2011, 07:40
Значит, она должна быть в стандартном формате djvu.
Именно. Делать полноценный pdf - нерационально ибо для этого книгу по сути придется заново корректировать и верстать, а djvu при прямых руках дает хорошее качество плюс очень точное воспроизведение оригинала.
Название: Plain text
Отправлено: Тайльнемер от декабря 27, 2011, 09:07
Цитата: Квас от декабря 27, 2011, 00:19
Цитата: Тайльнемер от декабря 25, 2011, 16:15
Электронная книга не должна ориентироваться на своего бумажного предка.
А я думаю — должна. Есть такая штука — дизайн. Со времён Гутенберга придумали много мелочей, которые не бросаются в глаза, но делают чтение комфортным.

Так надо придумать и реализовать такие фичи для электронных книг, а не зацикливаться на устаревшем.
Название: txt
Отправлено: Demetrius от декабря 27, 2011, 09:52
Цитата: arseniiv от декабря 26, 2011, 18:10
А мне, кстати, не нравится текст, претендующий на плэйновость, но являющийся текстом с переводами строки и удвоением-учетверением пробелов дабы стать похожим на выровненный по ширине.
-1. Текст с переводами строки тоже плейновый. Для его переделки в Юниксах есть стандартная утилита fmt. В Виндовс тоже что-то должно быть.