Нет ничего лучше обычного текста.
Люди, гонясь за внешним видом, забывают о смысле.
Вместо локальной вики достаточно обычного текстового редактора с поддержкой открытия файлов по какому-то щелчку (например, пусть бы это был двойной правый щелчок).
Проект Гутенберг всё делает правильно.
Проект Гутенберг конвертит тексты в кучу форматов.
Цитата: Bhudh от декабря 24, 2011, 23:57
Проект Гутенберг конвертит тексты в кучу форматов.
Ну, не в такую уж и кучу. И это делается автоматически, и никакого дополнительного форматирования там нет.
У меня цитатник в plain text. Рад, что кто-то понимает.
Списки без выравнивания левого края плохо читаемы, вложенные — бесполезны. А вложенные списки — один из лучших способов записи мыслей/заметок.
Выделенные заглавия, жирный текст облегчают восприятие записанного.
Гиперссылки помогают делить материал на части, не навязывая иерархии.
Но разрозненные заметки я тоже в плейне пишу.
Цитата: Alone Coder от У меня цитатник в plain text. Рад, что кто-то понимает.
Если б он ещё в уникоде был, было бы совсем радостно.
Текст это самое оно.
Никакой лишней информации, только сама информация. Проблема возникает только в случае передачи не текстовой информации, а другой информации (формулы, схемы и т. д.). Но это конечно не значит, что сам те 99% информации, которые являются простым текстом теперь надо искусственно увеличивать в размерах.
Сам стараюсь хранить всю информацию в текстовой форме. Это конечно не всегда удаётся, но благодаря юникоду можно достаточно много.
Цитата: Demetrius от декабря 24, 2011, 23:53
Нет ничего лучше обычного текста.
-1.
Терпеть не могу plain text.
Его используют, в основном, олдфаги, застрявшие в 80-х.
Plain text морально устарел. Давно и окончательно.
Цитата: Dana от декабря 25, 2011, 03:43
Терпеть не могу plain text.
Его используют, в основном, олдфаги, застрявшие в 80-х.
Plain text морально устарел. Давно и окончательно.
О чем я мечтаю...
О чем-то, что я называю wiki-офисом.
Желательно, чтобы его содержимое хранилось в Сети — чтобы я имел доступ к нему с любого своего компьютера. Доступ чтобы был прямой, по FTP. Или, может быть, чтобы хранилище было распределенным, чтобы для всякого объекта было три типа хранения: локальное, сетевое, или синхронизированное (при котором при котором каждый объект имеет локальную и сетевую копии обновляющиеся при подключении к сети).
Данные должны быть представлены в виде трех типов: wiki-страницы, медиа и база данных SQL.
Вики страницы — это папка с текстовыми файлами, в которых тупо написан вики-код.
Медиа — папка с картинками и т. п. Любой файл скинутый в папку становится автоматически доступным для вики.
В базе данных автоматически прописываются все файлы вики-офиса, а для страниц — и сравнения разных их версий, что обеспечивает возможность отката изменений.
Страницы можно редактировать любым текстовым редактором, но есть и встроенный, который позволяет просматривать текст и в режиме кода, и в «WYSIWIG» режиме. Есть возможность использования spread sheet, formula и прочих редакторов, которые создают в тексте страницы шаблоны содержащие данные, необходимые для рендеринга сложных wiki-объектов, и позволяющие редактировать их специализированными приложениями wiki-офиса. По красным ссылкам на медиа-объекты легко можно создавать необходимые векторные и растровые изображения с помощью встроенных редакторов.
Есть возможность создания коллекции CSS файлов, которые позволяют выбирать стиль отображения страниц — для браузинга, для чтения с экрана, для печати, для генерирования PDF и т.п.
Разным группам пользователей можно открывать различный уровень доступа к своим файлам.
Есть приложения, позволяющие организацию блогов и форумов (хотя формально их страницы остаются текстовыми wiki-файлами, с сохранением всей их функциональности).
Все приложения вики-офиса доступны как из браузера, так и в устанавливаемом виде (более функциональном).
Цитата: Dana от декабря 25, 2011, 03:43
Цитата: Demetrius от декабря 24, 2011, 23:53
Нет ничего лучше обычного текста.
-1.
Терпеть не могу plain text.
Его используют, в основном, олдфаги, застрявшие в 80-х.
Plain text морально устарел. Давно и окончательно.
Да да,
К примеру, этот (http://www.gutenberg.org/cache/epub/22367/pg22367.txt) текст просто неприятно читать, если он не весит на пару МБ больше...
И смыслу в нём станет как минимум на 146% больше после изменения формата...
Другой формат тут как раз и не нужен, всё и так понятно.
Цитата: Тайльнемер от декабря 25, 2011, 07:18
![+\frac34 [tex]+\frac34[/tex]](https://latex.codecogs.com/png.latex?+\frac34)
-F(1) ;-)
F(x)=∫(3/4)dx; F(0)=0.
Не для всего нужен TeX. Иногда можно и простым текстом обойтись (для любителей лиц в тексте есть даже такое ☺)
Простой текст ещё не значит полное отсутствие форматирования!
Разве кто-то мешает начать новую мысль с красной строки и вообще культурно оформить текст?
Также «простой текст» не отменяет других форматов, просто надо подходить к текстам с умом и видеть, когда он оправдан, а когда надо и о другом формате подумать.
Цитата: User Sapiens от декабря 25, 2011, 10:44
Не для всего нужен TeX. Иногда можно и простым текстом обойтись (для любителей лиц в тексте есть даже такое ☺)
Естественно!
За ТеХом
всегда стоит вёрстка, то есть внешний вид. Несмотря на установку «человек вводит текст, компьютер делает остальное», всё равно приходится сверяться с аутпутом, бороться с оверфуллами, вставлять разрывы страниц, а в особо тяжёлых случаях — устранять висячие сроки.
Если надо распечатать и читать, то нужен ТеХ (хороший дизайн добавляет в жизнь красоты). Если не надо распечатывать, то ТеХ не нужен, потому что как язык разметки он неудобен. Команда типа \emph напрочь убивает читаемость предложения, что уж говорить о тексте, насыщенном командами?
Цитата: User Sapiens от декабря 25, 2011, 10:44
Простой текст ещё не значит полное отсутствие форматирования!
Боян бояном, но я нагуглил совсем недавно:
(wiki/en) Lightweight_markup_language (http://en.wikipedia.org/wiki/Lightweight_markup_language)
Я теперь любитель Markdown-а. :) Ещё документация к vim-у произвела впечатление своей художественностью.
Цитата: Dana от декабря 25, 2011, 03:43
Plain text морально устарел. Давно и окончательно.
И что пришло ему на смену? Офис? :D
Цитата: Квас от декабря 25, 2011, 11:04
И что пришло ему на смену? Офис? :D
HTML и PDF ;)
Цитата: Dana от декабря 25, 2011, 11:07
PDF
Вы имеете в виду тот новодельный жирный полузакрытый формат, который поддерживают полторы глючных программы, который тормозит даже при прокрутке и который невозможно редактировать?
Цитата: Квас от декабря 25, 2011, 11:04
Я теперь любитель Markdown-а.
Посмотрел. Понравилось :)
Цитата: vfaronov от декабря 25, 2011, 01:18
Списки без выравнивания левого края плохо читаемы, вложенные — бесполезны.
Ну, есть всякие аутлайнеры, которые не только выравнивают по левому краю, но и свернуть дадут.
А с вложенными... Я лично разбиваю текст на строки. Ну, т.е. абзац у меня не одна большая строка, а много строк. Хотя у такого подхода тоже есть некоторые недостатки, но мне он нравится больше. А если кому не нравится, то переформатировать такой текст без проблем.
Цитата: vfaronov от декабря 25, 2011, 01:18
Выделенные заглавия, жирный текст облегчают восприятие записанного.
Никто не мешает использовать редакор, который выделяет
**такой** текст жирным и т.д. Если очень хочется.
Цитата: vfaronov от декабря 25, 2011, 01:18
Гиперссылки помогают делить материал на части, не навязывая иерархии.
Я уже говорил, но повторюсь: мне очень понравилось, как сделаны эрзац-гиперссылки в Acme. Простой щелчок правой кнопкой мыши по названию файла открывает этот файл. Всё!
По сути, такой минимальной функции достаточно для гипертекста.
Цитата: Bhudh от декабря 25, 2011, 01:30
Цитата: Alone Coder от У меня цитатник в plain text. Рад, что кто-то понимает.
Если б он ещё в уникоде был, было бы совсем радостно.
Не уверен. Когда я смотрю на уникод, мне хочется что-то с ним сделать.
Сам-то я использую уникод, но уверен, что это далеко не лучший вариант.
Цитата: Dana от декабря 25, 2011, 03:43
Терпеть не могу plain text.
Его используют, в основном, олдфаги, застрявшие в 80-х.
Plain text морально устарел. Давно и окончательно.
Вы очень правильно сказали:
морально устарел. Проблема не в том, что он плохой, а в том, как мы его воспринимаем.
Цитата: Hellerick от декабря 25, 2011, 07:23
О чем я мечтаю...
О чем-то, что я называю wiki-офисом.
Вроде бы всё, что Вы описали, не так уж и сложно сделать.
Сложнее будет в локальной версии сделать контроль версий. Либо а) при локальной работе надо не просто открывать файл в редакторе, но и после этого запускать программу, которая запишет изменения, либо б) надо открывать файлы только в спец. редакторе, который записывает изменения, в) надо постоянно держать запущенным демон, который следит за именениями файлов.
Цитата: Квас от декабря 25, 2011, 11:04
Боян бояном, но я нагуглил совсем недавно:
(wiki/en) Lightweight_markup_language (http://en.wikipedia.org/wiki/Lightweight_markup_language)
Я теперь любитель Markdown-а. :) Ещё документация к vim-у произвела впечатление своей художественностью.
А я втихаря пишу свой формат.
Сейчас конвертор уже понимает такое:
Это абзац. Абзацы отмечаются красной строкой. Впрочем,
бывают ещё абзацы без красной строки (такие часто встречаются
в английских рассказах), но они возможны только после пустой
строки. А вот список:
* Что-то
** Что-то вложенное
** И ещё вот так
* Ещё что-то
>| А вот это цитата.
>+ А вот это ещё одна цитата,
>| а вот она продолжается.
>| >| А вот это цитата в цитате. Блоки могут
>| >| иметь много уровней вложенности.
Правда, Вам мой формат не понравится.
У меня по задумке формат должен быть максимально простым и из открывающей разметки должно быть заранее понятно, какое будет форматирование. Такое решение убивает возможность для заголовков вида "Текст//-----" и для красивых маркдаун-подобных ссылок (но для них хочу потом сделать препроцессор).
Написано всё на Си, пока что меньше 300 вру, уже 350 строк кода. Хотелось бы, чтобы код не привышал 500 строк (правда, вряд ли я уложусь... разве что пробелы за строки не считать :green:), как максимум—тысячи.
Цитата: Alone Coder от декабря 25, 2011, 11:14
Цитата: Dana от декабря 25, 2011, 11:07
PDF
Вы имеете в виду тот новодельный жирный полузакрытый формат, который поддерживают полторы глючных программы, который тормозит даже при прокрутке и который невозможно редактировать?
Ну, на самом деле SumatraPDF очень неплоха. То, что невозможно редактировать—это фича; PDF, по сути,—замена для большой кучи картинок, а не для текста. Вот самое большое зло PDF: то, что автор может запретить копировать из файла текст, печатать файл и т.д.
Цитата: Dana от декабря 25, 2011, 11:07
HTML и PDF ;)
HTML слишком жирный. Для его отображения нужен целый браузер, а это одни из самых прожорливых к ресурсам программ.
Цитата: Demetrius от декабря 25, 2011, 12:33
А я втихаря пишу свой формат.
Я тоже писал. «CTF» назывался (сonventional text format).
Но сейчас я против выдумывания стандартов. Есть очень авторитетный синтаксис медиавики, и я считаю, что следует держаться его. Польза от его оптимизации не может превысить вреда от нестандартности.
А вообще, интересно подумать, что было бы, если бы HTML так и не появился, а вместо него с самого начала развивались light-weight форматы.
Цитата: Dana от декабря 25, 2011, 11:07
Цитата: Квас от декабря 25, 2011, 11:04И что пришло ему на смену? Офис? :D
HTML и PDF ;)
Слава богу, что не Офис. :)
Сравнивать PDF и текст некорректно. PDF есть некий способ сохранения
внешнего вида документа, при этом сам файл создаётся специфическими приложениями, которые непосредственно к формату PDF отношения не имеют. PDF — одна из форм output-а. Текстовый PDF-документ можно сделать в Блокноте, в Вёрде или в ТеХе, с совершенно разным итогом.
Сам по себе HTML нечитаем, нужен браузер. Да и писать HTML, наверно, не слишком удобно. HTML прочно ассоциируется с вебом. Почему именно его стоит использовать в качестве универсального формата?
Цитата: Hellerick от декабря 25, 2011, 12:54
Есть очень авторитетный синтаксис медиавики, и я считаю, что следует держаться его.
А почему? Мы говорим «медиавики», подразумеваем «википедия»? Кроме wiki-сайтов эта разметка где-то используется?
Цитата: Demetrius от
Сейчас конвертор уже понимает такое:
Это абзац. Абзацы отмечаются красной строкой. Впрочем,
бывают ещё абзацы без красной строки (такие часто встречаются
в английских рассказах), но они возможны только после пустой
строки. А вот список:
* Что-то
** Что-то вложенное
** И ещё вот так
* Ещё что-то
>| А вот это цитата.
>+ А вот это ещё одна цитата,
>| а вот она продолжается.
>| >| А вот это цитата в цитате. Блоки могут
>| >| иметь много уровней вложенности.
Весьма напоминает разметку в TiddlyWiki.
Цитата: Demetrius от декабря 25, 2011, 12:33HTML слишком жирный. Для его отображения нужен целый браузер
Целый браузер нужен для скриптов и стилей. Для чистого HTML всё это не нужно.
Цитата: Hellerick от декабря 25, 2011, 12:54
Но сейчас я против выдумывания стандартов. Есть очень авторитетный синтаксис медиавики, и я считаю, что следует держаться его. Польза от его оптимизации не может превысить вреда от нестандартности.
Синтаксис МедиаВики—это отвратительно. Он а) сложен для обработки, б) неинтуитивен, в) сложен для использования с русским текстом (нужно лепить раскладку с апострофами).
Да и вообще, никакой он не стандарт. Где он используется, кроме как в МедиаВики? По-моему нигде.
Если я и соглашусь на какой-то существующий формат, то разве что на Креоль (http://en.wikipedia.org/wiki/Creole_%28markup%29). Хотя мне и в нём многое не нравится.
Цитата: Квас от декабря 25, 2011, 13:10
А почему? Мы говорим «медиавики», подразумеваем «википедия»? Кроме wiki-сайтов эта разметка где-то используется?
Даже на вики-сайтах далеко не на всех.
Цитата: Квас от декабря 25, 2011, 13:09
Сам по себе HTML нечитаем, нужен браузер. Да и писать HTML, наверно, не слишком удобно. HTML прочно ассоциируется с вебом. Почему именно его стоит использовать в качестве универсального формата?
Писать его нормально, я часто так делаю. А используется он в качестве универсального формата по той простой причине, что программы для его чтения есть везде.
Цитата: Bhudh от декабря 25, 2011, 13:11
Весьма напоминает разметку в TiddlyWiki.
А у них тоже абзацы с красной строки?
Цитата: Bhudh от декабря 25, 2011, 13:11
Цитата: Demetrius от декабря 25, 2011, 12:33HTML слишком жирный. Для его отображения нужен целый браузер
Целый браузер нужен для скриптов и стилей. Для чистого HTML всё это не нужно.
Чистый HTML без стилей? Где найти легковесные программы для отображения такого чуда?
Цитата: Квас от декабря 25, 2011, 13:09
Сам по себе HTML нечитаем, нужен браузер. Да и писать HTML, наверно, не слишком удобно.
Зависит от того, насколько он загажен стилями, скриптами и семантической лабудой. В простейшем случае, html пишется/читается не намного сложнее, чем bbcode (язык разметки, используемый для сообщений на форумах).
Цитата: Demetrius от декабря 25, 2011, 13:11
(нужно лепить раскладку с апострофами).
А как вы в своем формате «>» набираете?
От медиавики просто уже невозможно отказаться. Википедия, может быть, написана на века, и ее код будут править в марсианских колониях.
А раз медиавики, в отличие от всего остального, не исчезнет, то проще всё что только можно свести к нему.
Что касается красной строки, то я стараюсь от нее избавиться — также как и от десятичной запятой. Национальный стандарт, от которого слишком много мороки, чтобы продолжать его придерживатсья.
Цитата: Demetrius от А у них тоже абзацы с красной строки?
Вот только до этого не додумались. Там, кстати, и есть Креоль.
Ты помнишь, что пробелы в начале строки в МедиаВики значат?
Цитата: Demetrius от Чистый HTML без стилей? Где найти легковесные программы для отображения такого чуда?
Да даже со стилями. Wisiwig-проги без скриптов, но с предпросмотром больше браузеров весят, что ли?
Цитата: Demetrius от декабря 25, 2011, 13:17
Чистый HTML без стилей? Где найти легковесные программы для отображения такого чуда?
Lynx/Links/еще какой-то браузер для текстового терминала?..
Кстати, в Опере можно отключать отображение стилей (т. н. «пользовательский режим» вместо «авторского»). Конечно, это не самая легковесная программа, и html без стилей часто выглядит довольно уродски, но некоторые страницы, со стилями вешающие браузер минут на пять, с отключенными стилями грузятся сравнительно мгновенно.
Цитата: Demetrius от декабря 25, 2011, 13:17
Цитата: Квас от декабря 25, 2011, 13:09Сам по себе HTML нечитаем, нужен браузер. Да и писать HTML, наверно, не слишком удобно. HTML прочно ассоциируется с вебом. Почему именно его стоит использовать в качестве универсального формата?
Писать его нормально, я часто так делаю. А используется он в качестве универсального формата по той простой причине, что программы для его чтения есть везде.
Мне кажется, что <em></em> убивает читаемость не меньше, чем \emph{}. Текст с тегами — фе.
«Универсальный формат» я имел в виду несколько в другом смысле: например, сюда относятся повседневное использование или текстовая справка к программам. С тегами связываться никакого желания. Поэтому я и выступаю за лёгкую разметку (возможно, самодельную) плюс конвертеры (возможно, самодельные). Кстати, ваша разметка весьма симпатична. :yes:
Цитата: Python от некоторые страницы, со стилями вешающие браузер минут на пять, с отключенными стилями грузятся сравнительно мгновенно.
Значит, просто стили (или тэги) прописаны криво, и браузер тщетно пытается определить, какой куда совать.
Цитата: Python от декабря 25, 2011, 13:22
Цитата: Квас от декабря 25, 2011, 13:09Сам по себе HTML нечитаем, нужен браузер. Да и писать HTML, наверно, не слишком удобно.
Зависит от того, насколько он загажен стилями, скриптами и семантической лабудой. В простейшем случае, html пишется/читается не намного сложнее, чем bbcode (язык разметки, используемый для сообщений на форумах).
bbcode я тоже не хочу читать. Привередлив-с. :)
ЦитироватьМне кажется, что <em></em> убивает читаемость не меньше, чем \emph{}. Текст с тегами — фе.
Однобуквенные (<b>, <i>, <u>, <s>) еще как-то можно терпеть. html начал портиться, когда пошла мода менять их на «семантические», хотя в чем практическое отличие <strong> от <b>, сказать сложно. Еще хуже, когда вместо них используется <span> с кучей параметров, когда за раздутой «разметкой» не видно самого текста.
Цитата: Hellerick от декабря 25, 2011, 13:22
А как вы в своем формате «>» набираете?
У меня формат пока что не устоялся. Вместо
| как знака продолжения блока можно использовать
:. Вместо (или вместе с?)
> тоже будет какой-нибудь знак. Может,
), пока что не знаю.
Цитата: Hellerick от декабря 25, 2011, 13:22
От медиавики просто уже невозможно отказаться. Википедия, может быть, написана на века, и ее код будут править в марсианских колониях.
А раз медиавики, в отличие от всего остального, не исчезнет, то проще всё что только можно свести к нему.
С чего Вы взяли, что они будут делать это именно на языке разметки МедиаВики? Что помешает в марсианских колониях перевести Википедию в другой формат?
Цитата: Hellerick от декабря 25, 2011, 13:22
Что касается красной строки, то я стараюсь от нее избавиться — также как и от десятичной запятой. Национальный стандарт, от которого слишком много мороки, чтобы продолжать его придерживатсья.
В том-то и дело, что мне её не хватало в
английских текстах. В русских-то всё понятно: каждый абзац с красной строки. А в английских бывают абзацы с красной строкой, а бывают без (после заголовков и пустых строк). И Маркдаун это различие передать не даёт.
Цитата: Bhudh от декабря 25, 2011, 13:24
Цитата: Demetrius от А у них тоже абзацы с красной строки?
Вот только до этого не додумались. Там, кстати, и есть Креоль.
Ты помнишь, что пробелы в начале строки в МедиаВики значат?
А какая разница, что они значат в МедиаВики? В МедиаВики очень запутанный и нелогичный синтаксис. Зачем его копировать?
Цитата: Bhudh от декабря 25, 2011, 13:24
Да даже со стилями. Wisiwig-проги без скриптов, но с предпросмотром больше браузеров весят, что ли?
Они используют движок IE же. Который о-о-оч-чень тяжеловесный.
Цитата: Python от декабря 25, 2011, 13:26
Lynx/Links/еще какой-то браузер для текстового терминала?..
А чем это лучше плейн текста? :what:
Доречі, на синтаѯис блоків в моєму форматі достатньо сильно повпливалав ваш формат даних (той, який «Дерево замість ѮМЛ»). Принаймні звідти я взяв ідею, що повинні бути окремі символи для початку блоку і для продовження (у Вас це
> і
*, у мене для блоків це
М+ і
М|, де
M—мітка типу блоку). Правда, я ще добавив можливість починати рядок зі знаку продовження блоку, якщо це не створює двозначності.
Цитата: Demetrius от Они используют движок IE же.
Даже Линуховые⁈ :o
Цитата: Квас от декабря 25, 2011, 13:32
Поэтому я и выступаю за лёгкую разметку (возможно, самодельную) плюс конвертеры (возможно, самодельные).
IMHO тут выбор между тяжеловесностью и самодельностью. Легковесная программа заведомо будет делать не всё; и её заведомо надо будет адаптировать к другим требованиям
Из более-менее тяжеловесных, но читаемых, есть AsciiDoc и reStructuredText. В них, в принципе, есть всё, что надо в большинстве случаев. Но хочется чего-то попроще.
Я вот поэтому хочу, чтобы в моём конверторе новые блоки можно было добавлять и менять простым редактированием одной структуры в файле.
Цитата: Квас от декабря 25, 2011, 13:32Кстати, ваша разметка весьма симпатична. :yes:
:-[
Я её ещё доведу до ума, а потом обнародую. Пока что у меня нет внутритекстового форматирования. Точнее, оно недописано. Думаю сделать //такой// курсив и **такой** полужирный. Ну, и ещё со ссылками не определился.
Цитата: Python от декабря 25, 2011, 13:43
html начал портиться, когда пошла мода менять их на «семантические», хотя в чем практическое отличие <strong> от <b>, сказать сложно. Еще хуже, когда вместо них используется <span> с кучей параметров, когда за раздутой «разметкой» не видно самого текста.
IMHO идея не плодить новых версий HTML и переводить всех на XML была очень здравой. Но создался WHATWG, и там стали клепать этот уродливый HTML5. :'(
Цитата: Bhudh от декабря 25, 2011, 13:57
Цитата: Demetrius от Они используют движок IE же.
Даже Линуховые⁈ :o
Линуксовые тоже используют какой-нибудь готовый движок, типа Gecko/WebKit/KHTML/&c.
Кстати, Hellerick, покажите свой формат, пожалуйста!
Цитата: Demetrius от декабря 25, 2011, 14:14
Кстати, Hellerick, покажите свой формат, пожалуйста!
Ой, это было так давно, что, теперь едва ли что-то можно найти.
Но там были красные строки и даже знаки переноса (дефис считался мягким, если сразу после него шел перенос строки; чтобы этого избежать, между дефисом и переносом строки ставился пробел).
Пока я читал эту дискуссию, я кое-что кропал в блокнотике:
{*bold text*}
{/italic text/}
{_underlined text_}
{^superscript text^}
{,subscript text,}
{=Header=}
{==Header of second level==}
{=#1 Header with an anchor=}
{>destination linked text}
{>#anchor text linked to an anchor}
{| table header
| table | row | one
| table | row | two
|}
{| quote header
quote (i.e. a quote is kind of a table consisting of just one cell)
|}
{#
Preformatted text (code)
#}
Но для обычной русской раскладки это, конечно, не подходит. Разве что попробовать заменить фигурные скобки обычными.
Иметь общий набор спецсимволов для кодов (как {} у Вас и <> в XML), безусловно, элегантно и удобно, но, по моему скромному мнению, текст с такой разметкой не очень подходит для чтения в «сыром» виде. Хотя да, безусловно, идея очень симпатичная.
Цитата: Demetrius от IMHO идея не плодить новых версий HTML и переводить всех на XML была очень здравой.
И все бы попёрли выдумывать новые тэги.
А теперь представь ужас на дисплее, когда файл xml загрузился, а dtd где-то подвис...
Цитата: Hellerick от
{*bold text*}
{/italic text/}
{_underlined text_}
{^superscript text^}
{,subscript text,}
{=Header=}
{==Header of second level==}
{=#1 Header with an anchor=}
{>destination linked text}
{>#anchor text linked to an anchor}
{| table header
| table | row | one
| table | row | two
|}
{| quote header
quote (i.e. a quote is kind of a table consisting of just one cell)
|}
{#
Preformatted text (code)
#}
Не выдерживаю и даю-таки Креольскую тиддли-разметку:
''полужирный''
//курсивный//
''//полужирный курсив//''
__подчёркнутый__
--зачёркнутый--
^^над^^строчный
~~под~~строчный
@@подсвеченный@@
{{{моноширинный}}}
Не будем изобретать велосипедов, г-да!
Разумеется, что-то новое здесь придумать сложно. Кругом изобретатели велосипедов.
Попарвляюсь насчет оформления ссылок. Интуитивнее сначала писать текст, и только потом адрес. Например так:
Why don't you ask {here >google.com<}?
Бесят книги в формате DOC, RTF и TXT. Ну это изврат просто...
Русские особенно такой садомазохизм любят, на Западе такое реже встречается. Олдфаги-хардкорщики, блин.
Есть же человеческий PDF.
Цитата: Dana от декабря 25, 2011, 15:53
Есть же человеческий PDF.
Бесит.
Воспринимаю PDF как недораспознанный формат.
Полфабрикат, над которым еще нужно попотеть, чтобы преобразовать его во что-нибудь юзабельное.
Цитата: Dana от декабря 25, 2011, 15:53
Бесят книги в формате DOC, RTF и TXT. Ну это изврат просто...
Они прекрасно идут в читалках! Правда, если вычитаны хорошо.
Цитата: Hellerick от декабря 25, 2011, 15:57
Воспринимаю PDF как недораспознанный формат.
Полфабрикат, над которым еще нужно попотеть, чтобы преобразовать его во что-нибудь юзабельное.
В смысле?
А чего там не хватает?
Цитата: I. G. от декабря 25, 2011, 15:58
Они прекрасно идут в читалках!
В каких?
Цитата: I. G. от декабря 25, 2011, 15:58
Правда, если вычитаны хорошо.
Ото ж.
Цитата: Dana от декабря 25, 2011, 16:02
Цитата: I. G. от декабря 25, 2011, 15:58Они прекрасно идут в читалках!
В каких?
Покетбук какой-то у меня. По вечерам читываю. ::)
Цитата: Dana от декабря 25, 2011, 15:53
Бесят книги в формате DOC, RTF и TXT. Ну это изврат просто...
Русские особенно такой садомазохизм любят, на Западе такое реже встречается. Олдфаги-хардкорщики, блин.
Есть же человеческий PDF.
−1
PDF — эмулятор бумаги. Электронная книга не должна ориентироваться на своего бумажного предка.
Цитата: Dana от декабря 25, 2011, 16:02
А чего там не хватает?
Выбора размера шрифта, количества и ширины колонок, разбиения или не разбиения на страницы; возможности редактирования текста и т. п.
Цитата: Dana от декабря 25, 2011, 15:53
Есть же человеческий PDF.
Цитата: Alone Coder от декабря 25, 2011, 11:14
Вы имеете в виду тот новодельный жирный полузакрытый формат, который поддерживают полторы глючных программы, который тормозит даже при прокрутке и который невозможно редактировать?
Только djvu со слоем распознанного текста православен. Вычитанный и заново сверстанный pdf - это конечно хорошо, но уж больно геморойно, особенно учитывая нынешние масштабы оцифровки всего и вся.
Цитата: Dana от декабря 25, 2011, 15:53
Бесят книги в формате DOC, RTF и TXT. Ну это изврат просто...
Русские особенно такой садомазохизм любят, на Западе такое реже встречается. Олдфаги-хардкорщики, блин.
Есть же человеческий PDF.
-много
Книги в TXT православнее всего.
Кстати, часто нарываюсь на китайские книги именно в формате TXT. Это радует.
Цитата: Bhudh от декабря 25, 2011, 14:38
Цитата: Demetrius от IMHO идея не плодить новых версий HTML и переводить всех на XML была очень здравой.
И все бы попёрли выдумывать новые тэги.
Так это же замечательно.
Цитата: Bhudh от декабря 25, 2011, 14:38А теперь представь ужас на дисплее, когда файл xml загрузился, а dtd где-то подвис...
Там будет не ужас, а вполне себе красивое деревце. Да и ситуация гипотетическая, у Вас часто CSS «где-то подвисает»?
Цитата: Bhudh от декабря 25, 2011, 14:38Не выдерживаю и даю-таки Креольскую тиддли-разметку:''полужирный''
//курсивный//
''//полужирный курсив//''
__подчёркнутый__
--зачёркнутый--
^^над^^строчный
~~под~~строчный
@@подсвеченный@@
{{{моноширинный}}}
Не будем изобретать велосипедов, г-да!
Это нифига не креоль. В креоле **полужирный**. См. креольную шпаргалку (http://www.wikicreole.org/attach/CheatSheet/creole_cheat_sheet_german.html).
А что такое «@@подсвеченный@@»?
все должно быть в djvu
По-моему, вы сейчас о разных вещах говорите.
У которого фон другого цвета, видимо. :donno:
Цитата: Тайльнемер от декабря 25, 2011, 16:15
Выбора размера шрифта, количества и ширины колонок, разбиения или не разбиения на страницы; возможности редактирования текста и т. п.
Ну мне этого и не нужно в отформатированной книге. Меня устраивает эмулятор бумаги.
Хорошо отформатированный текст мне легче усваивать.
Цитата: Demetrius от Там будет не ужас, а вполне себе красивое деревце. Да и ситуация гипотетическая, у Вас часто CSS «где-то подвисает»?
Может, и не часто, но сама возможность есть.
И потом, «деревце» — это дополнительный парсинг. Вдруг файл обфускованный?
Цитата: Hellerick от декабря 25, 2011, 17:46
А что такое «@@подсвеченный@@»?
Цитата: Demetrius от декабря 25, 2011, 18:14У которого фон другого цвета, видимо.
По дефолту — жёлтого.
Цитата: Demetrius от декабря 25, 2011, 14:02
Легковесная программа заведомо будет делать не всё; и её заведомо надо будет адаптировать к другим требованиям
Поразмыслил.
И тяжеловесная делает не всё. HTML не делает того, что делает
![\mbox{\TeX} [tex]\mbox{\TeX}[/tex]](https://latex.codecogs.com/png.latex?\mbox{\TeX})
, и обратно. Нельзя объять необъятное. Легковесная разметка — некий каркас, который удобно и сам по себе использовать, и (теоретически) конвертировать. А после конвертации можно и шлифовать.
Цитата: Python от декабря 25, 2011, 13:26
Цитата: Demetrius от декабря 25, 2011, 13:17
Чистый HTML без стилей? Где найти легковесные программы для отображения такого чуда?
Lynx/Links/еще какой-то браузер для текстового терминала?..
elinks, links2, w3m и думаю есть ещё несколько.
Я пользуюсь elinks и w3m. Ими пользоваться конечно можно и даже неплохо, но большинство страниц не рассчитаны на такое и не всегда отображаются хорошо, но с этим ничего не поделать.
Ещё вариант, который я также использую, это броузер где почти всё отключено. Он конечно весит побольше чем терминальные броузеры, но загружает всё быстрее, чем стандартные без специфических настроек.
Цитата: Bhudh от декабря 25, 2011, 22:53
И потом, «деревце» — это дополнительный парсинг. Вдруг файл обфускованный?
Обфускация затрудняет понимание для
человека. А компьютеру всё равно.
А парсинг по любому выполняется. Браузер по любому строит DOM, который как раз это самое дерево и есть.
Да знаю.
Цитата: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<body>
<script type="text/javascript">
<script src="http://www.google-analytics.com/ga.js" type="text/javascript"/>
<script type="text/javascript">
<table width="100%">
<tbody>
<tr>
<td>
<div id="mainframe">
<div class="tborder">
<div id="main_menu">
<br/>
<div id="bodyarea">
<center/>
<table width="100%">
<tbody>
<tr valign="top">
<td width="150" id="ad1" style="overflow: hidden">
<td>
<table width="100%">
<script type="text/javascript" src="http://lingvoforum.net/Themes/Lingvoforum/display.js"/>
<script type="text/javascript">
<a name="msg1128388"/>
<div class="clearfix margintop" id="postbuttons">
<div id="forumposts" class="tborder">
<h3 class="catbg3">
<div id="whoisviewing" class="smalltext headerpadding windowbg2">
<form action="[url=http://lingvoforum.net/index.php?action=quickmod2;topic=42673.25"]Plain text[/url]; method="post" accept-charset="UTF-8" name="quickModForm" id="quickModForm" style="margin: 0;" onsubmit="return oQuickModify.bInEditMode ? oQuickModify.modifySave('24056ee2ffc41f299092875463dfd3e0') : false">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
<div class="bordercolor">
</form>
</div>
<a name="lastPost"/>
<div class="clearfix marginbottom" id="postbuttons_lower">
<div id="moderationbuttons"/>
<div class="tborder">
<br/>
<a name="quickreply"/>
<div class="tborder" id="quickreplybox">
<script language="JavaScript" type="text/javascript" src="http://lingvoforum.net/Themes/Lingvoforum/scripts/xml_topic.js"/>
<script language="JavaScript" type="text/javascript">
<center style="margin-top: 10px;"/>
</td>
</tr>
</tbody>
</table>
<a href="javascript:void(0)" onclick="var d=new Date(); d.setDate(d.getDate()+90); document.cookie = "show="+(document.getElementById("ad1").style.display!="")+";expires="+d.toGMTString()+"; path=/"; document.getElementById("ad1").style.display = document.getElementById("ad1").style.display==""?"none":"";" align="right">
</div>
<div id="footerarea" class="headerpadding topmargin clearfix">
</div>
</td>
</tr>
</tbody>
</table>
</body>
</html>
Цитата: Dana от декабря 25, 2011, 19:37
Ну мне этого и не нужно в отформатированной книге. Меня устраивает эмулятор бумаги.
Хорошо отформатированный текст мне легче усваивать.
Когда у вас появится ебук, резко разлюбите нормальные форматы и полюбите ненормальные.
(Меня вернули мыслями к формату словарей (с языка на язык которые). Надо бы тему создать, а то я с ним без помощи не разберусь...)
Вот она: Словарь лингвофорумчанина (http://lingvoforum.net/index.php/topic,42754.0.html).
А то с левой панели быстро уезжает, а так хоть кто-нибудь заметит... :???
Прости, Deme., за оффтопье.
Я сейчас одновременно смотрю мультяшку, редактирую текстовой файл и читаю PDF, так что мне и экрана ноутбука не хватает для комфортного просмотра PDF. Приходится между зумом и скроллом искать меньшее зло.
Цитата: Dana от декабря 25, 2011, 15:53
Бесят книги в формате DOC, RTF и TXT. Ну это изврат просто...
Русские особенно такой садомазохизм любят, на Западе такое реже встречается. Олдфаги-хардкорщики, блин.
Есть же человеческий PDF.
DOC и RTF — да, изврат. TXT хорош тем, что нетребователен к ресурсам. Кому не нравится плейн-текст — в чем проблема переделать его в простейший html, добавив <pre> сверху и </pre> снизу? При необходимости, также можно прицепить заголовок с указанием кодировки.
А мне, кстати, не нравится текст, претендующий на плэйновость, но являющийся текстом с переводами строки и удвоением-учетверением пробелов дабы стать похожим на выровненный по ширине. По той ширине, которая тебе не нравится, и с такими же пробельными фокусами. Именно, его нельзя сконвертировать во что-нибудь нормальное быстро и без мучений.
Цитата: arseniiv от декабря 26, 2011, 18:10
Именно, его нельзя сконвертировать во что-нибудь нормальное быстро и без мучений.
Если в нём нет "таблиц", то нет ничего проще - меняем двойной перевод строки на <p>, расширение на .html, и готово!
А как вы справитесь с изредка встречающимися немягкими переносами-дефисами?
Так же, как и с опечатками в обычной книге - путём их игнорирования :-)
Если невозможно определить, перенос это или дефис, можно поставить после него <br> на всякий случай.
Цитата: Тайльнемер от декабря 25, 2011, 16:15
PDF — эмулятор бумаги. Электронная книга не должна ориентироваться на своего бумажного предка.
:+1:
Цитата: Тайльнемер от декабря 25, 2011, 16:15Цитата: Dana от декабря 25, 2011, 16:02
А чего там не хватает?
Выбора размера шрифта, количества и ширины колонок, разбиения или не разбиения на страницы; возможности редактирования текста и т. п.
:+1:
Цитата: arseniiv от декабря 26, 2011, 18:10
Именно, его нельзя сконвертировать во что-нибудь нормальное быстро и без мучений.
Легко, одним махом.
Правда, работал я над этим конвертером довольно долго. Больше тысячи строк скриптового языка, не говоря уже об используемых им функциях редактора, написанных на ассемблере.
Цитата: sasza от декабря 26, 2011, 18:27
Если в нём нет "таблиц", то нет ничего проще - меняем двойной перевод строки на <p>, расширение на .html, и готово!
И с таблицами, как правило, он справляется легко, если эти таблицы оформлены как следует. Если нет — подрисовываем сначала каждую таблицу как положено (это очень быстро: стрелочками передвигаем курсор, Shift-стрелочками рисуем, есть также клавиши для расширения и разделения строк и столбцов).
Цитата: arseniiv от декабря 26, 2011, 18:40
А как вы справитесь с изредка встречающимися немягкими переносами-дефисами?
А вот это уже сложнее. Тут словарь нужен.
Мне не так часто приходилось конвертировать тексты с переносами, так что я ограничился запросом на каждый дефис-или-перенос с запоминанием выбора (на один сеанс).
Прилагаю исходник, если интересно.
Сам редактор со всеми фичами я уже как-то выкладывал.
Цитата: Тайльнемер от декабря 25, 2011, 16:15
PDF — эмулятор бумаги. Электронная книга не должна ориентироваться на своего бумажного предка.
Если книга изначально создавалась как электронная, то на здоровье, извращайтесь как хотите. Но если это копия бумажной книги, то она должна быть как можно более точной копией, не месивом из текста.
Цитата: Oleg Grom от декабря 26, 2011, 23:44
Но если это копия бумажной книги, то она должна быть как можно более точной копией, не месивом из текста.
:+1:
ЦитироватьЭлектронная книга не должна ориентироваться на своего бумажного предка.
Теоретически, можно согласиться. Практически — годных чисто электронных стандартов с графическими возможностями pdf я пока не видел. html слишком сырой и слишком нестабильный, кроме того, несколько мешает многофайловость html — для книжки, хранимой на локальном диске, это скорее минус. Да, и что там с подгружаемыми шрифтами — общепринятый стандарт существует, или только в далеком будущем?..
А вообще, «бумажность» pdf — в чем-то даже преимущество. Мне лично удобнее формат, где длинное полотно текста разбито на страничные порции с запоминаемыми номерами. Сплошной html неудобен своей неструктурированностью. html в виде кучи маленьких файликов неудобен тем, что их нельзя быстро пролистывать. К тому же, преимущество html в виде «резинового» форматирования зачастую теряется из-за слишком большой свободы и криворукости дизайнеров, которым ничего не стоит сделать фиксированную ширину блока текста, ориентируясь на монитор в два раза шире моего.
Цитата: Python от Да, и что там с подгружаемыми шрифтами — общепринятый стандарт существует, или только в далеком будущем?..
Разве
@font-face поддерживают ещё не все?‥
Цитата: Bhudh от декабря 26, 2011, 23:56
Цитата: Python от Да, и что там с подгружаемыми шрифтами — общепринятый стандарт существует, или только в далеком будущем?..
Разве @font-face поддерживают ещё не все?‥
Помнится, еще недавно была ситуация «все, да по-разному».
Цитата: Alone Coder от декабря 25, 2011, 00:21
У меня цитатник в plain text. Рад, что кто-то понимает.
Я тоже всю информацию сохраняю в plain text. Если там много разметки — конвертирую затем в HTML и там дорабатываю.
Цитата: vfaronov от декабря 25, 2011, 01:18
Списки без выравнивания левого края плохо читаемы, вложенные — бесполезны. А вложенные списки — один из лучших способов записи мыслей/заметок.
В моём редакторе есть фича, позволяющая скрывать строки с отступом больше выбранного. Создавалась изначально (не мной) для языков программирования, но и тут может быть полезна.
Цитата: vfaronov от декабря 25, 2011, 01:18
Выделенные заглавия, жирный текст облегчают восприятие записанного.
Мой редактор автоматически выделяет заглавия.
Заглавия помечены строкой символов (по умолчанию — один символ LF, т.е. ASCII 12).
Кроме выделения, это и отметка для конвертера, определяющая строку как <H2>...<H6> (в зависимости от отступа между символом заголовка и самим заголовком).
С жирным шрифтом хуже. Я помечаю ◄так►, конвертер понимает и переводит <b>так</b>. Но цветом редактор это не выделяет.
Цитата: vfaronov от декабря 25, 2011, 01:22
Но разрозненные заметки я тоже в плейне пишу.
:+1:
Цитата: User Sapiens от декабря 25, 2011, 01:47
Сам стараюсь хранить всю информацию в текстовой форме.
:+1:
Цитата: Python от декабря 25, 2011, 13:43
ЦитироватьМне кажется, что <em></em> убивает читаемость не меньше, чем \emph{}. Текст с тегами — фе.
Однобуквенные (<b>, <i>, <u>, <s>) еще как-то можно терпеть. html начал портиться, когда пошла мода менять их на «семантические», хотя в чем практическое отличие <strong> от <b>, сказать сложно. Еще хуже, когда вместо них используется <span> с кучей параметров, когда за раздутой «разметкой» не видно самого текста.
:+1:
Всегда перевожу такое.
strong→b и em→i вручную, а для избавления от span используется одна из фичей моего довольно мощного HTML-оптимизатора.
Ну как по-разному...
Каждому браузеру вписывается шрифт в поддерживаевом им формате, а так-то правило для всех единое.
Цитата: Тайльнемер от декабря 25, 2011, 16:15
Электронная книга не должна ориентироваться на своего бумажного предка.
А я думаю — должна. Есть такая штука — дизайн. Со времён Гутенберга придумали много мелочей, которые не бросаются в глаза, но делают чтение комфортным.
Два примера работы моего конвертера. Один — с заголовками, второй — с таблицами.
Исходный текст, результат в HTML, screenshot текста, screenshot режима «только заголовки».
Цитата: Oleg Grom от декабря 26, 2011, 23:44
Но если это копия бумажной книги, то она должна быть как можно более точной копией, не месивом из текста.
Значит, она должна быть в стандартном формате djvu.
Цитата: Alone Coder от декабря 27, 2011, 07:40
Значит, она должна быть в стандартном формате djvu.
Именно. Делать полноценный pdf - нерационально ибо для этого книгу по сути придется заново корректировать и верстать, а djvu при прямых руках дает хорошее качество плюс очень точное воспроизведение оригинала.
Цитата: Квас от декабря 27, 2011, 00:19
Цитата: Тайльнемер от декабря 25, 2011, 16:15
Электронная книга не должна ориентироваться на своего бумажного предка.
А я думаю — должна. Есть такая штука — дизайн. Со времён Гутенберга придумали много мелочей, которые не бросаются в глаза, но делают чтение комфортным.
Так надо придумать и реализовать такие фичи для электронных книг, а не зацикливаться на устаревшем.
Цитата: arseniiv от декабря 26, 2011, 18:10
А мне, кстати, не нравится текст, претендующий на плэйновость, но являющийся текстом с переводами строки и удвоением-учетверением пробелов дабы стать похожим на выровненный по ширине.
-1. Текст с переводами строки тоже плейновый. Для его переделки в Юниксах есть стандартная утилита
fmt. В Виндовс тоже что-то должно быть.