Опрос
Вопрос:
Что вы обычно используете
Вариант 1: ... (один специальный символ)
голосов: 8
Вариант 2: ... (три точки подряд)
голосов: 14
Опрос — это так, на всякий случай. А вопрос у меня такой:
Цитата: Те́ма Лебедев
§ 164. Многоточие
8 июля 2010
Всем известно многоточие...
Но не всем известно, что многоточие не должно быть символом, созданным для экономии байтов и моноширинного набора (...).
В книгах и других видах благородного набора уместно применение только того многоточия, которое состоит из трех отдельных точек (...).
Вопрос: кто-нибудь может восстановить здесь логику рассуждений Темы?
Как я понимаю, дело тут во внешнем виде ... по сравнению с ..., так как если дело, так сказать, в логике, то утверждение Темы вообще очень странно́.
Оставим пока моноширинные шрифты в покое, и рассмотрим пропорциональные. Если многоточие в пропорциональном шрифте должно выглядеть именно так, как выглядят три точки подряд, то зачем создатели шрифта сделали символ многоточия отличным по виду?
Я так понимаю, что вид символа многоточия в пропорциональных шрифтах отражает как раз то, ка́к создатель шрифта задумал, чтобы многоточие в этом шрифте выглядело. А три точки подряд могут выглядеть как угодно, ведь пробелы вокруг точки определяются из предположения, что это точка, а не многоточие. Не так?
Цитата: Тайльнемер от августа 26, 2010, 07:23
§ 164. Многоточие
8 июля 2010
Всем известно многоточие...
Но не всем известно, что многоточие не должно быть символом, созданным для экономии байтов и моноширинного набора (...).
В книгах и других видах благородного набора уместно применение только того многоточия, которое состоит из трех отдельных точек (...).
Потому что горизонт завален.
В шрифтах можно делать замену, чтобы было даже невозможно поставить три точки подряд.
В разных странах правила полиграфии различаются, в том числе и внешний вид троеточия. А символ троеточия в шрифте всего один.
К сожалению, сейчас не могу привести ссылку на правила и рекомендации, давно я этим занимался, но насколько я помню, в данном случае Лебедев прав.
По мне, так самостоятельный знак посимпатичнее будет.
Смотря в каком шрифте. В моноширинных многоточие обычно получается слишком мелким.
Цитата: Тайльнемер от августа 26, 2010, 07:23
Я так понимаю, что вид символа многоточия в пропорциональных шрифтах отражает как раз то, ка́к создатель шрифта задумал, чтобы многоточие в этом шрифте выглядело. А три точки подряд могут выглядеть как угодно, ведь пробелы вокруг точки определяются из предположения, что это точка, а не многоточие. Не так?
Мне вспоминается, что по стандарту Уникода они эквивалентны.
В английской типографике многоточие — отдельный (и недробимый) знак, а русской — это именно три точки. Доказательством этого может служить то, как принято сочетать многоточие с другими знаками. В русском языке пишут «?..», «!..», а в английском — «...!», «...?».
Если у нас нет отдельного знака для «!..», то и знаком «...» мы пользоваться не должны.
Цитата: oort от августа 26, 2010, 13:22
В разных странах правила полиграфии различаются, в том числе и внешний вид троеточия. А символ троеточия в шрифте всего один.
Интересно. Спасибо.
То есть, это про русское многоточие так?
Цитата: myst от августа 26, 2010, 13:42
Мне вспоминается, что по стандарту Уникода они эквивалентны.
Кажется, нет. По крайней мере каноническое разложение не делит его на точки.
Представьте, если в тексте не 3, а ≥4 точек подряд, как их комбинировать при каноническом объединении?
В уникоде определено, что ... переходит в ... в каком-то случае вроде проблем совместимости, но они не эквивалентны.
Цитата: Hellerick от августа 26, 2010, 14:13
Если у нас нет отдельного знака для «!..», то и знаком «...» мы пользоваться не должны.
Логично, я тоже щас об этом подумал.
Надо написать петишн уникоду, чтобы добавили !.. и ?.. как отдельные символы, тогда можно будет использовать '...'.
Цитата: oort от августа 26, 2010, 13:22
К сожалению, сейчас не могу привести ссылку на правила и рекомендации, давно я этим занимался, но насколько я помню, в данном случае Лебедев прав.
В каком из случаев?
Цитата: Hellerick от августа 26, 2010, 14:13
?..
Дико люто бешенно бесит кривой кернинг во всех шрифтах: расстояние между точкой под «?» и следующей точкой должно быть равно расстоянию между двумя обычными точками, а не больше.
Цитата: Тайльнемер от августа 26, 2010, 14:16
В уникоде определено, что ... переходит в ... в каком-то случае вроде проблем совместимости, но они не эквивалентны.
Цитата: http://en.wikipedia.org/wiki/Horizontal_ellipsis#Computer_representations
Unicode recognizes a series of three period characters (U+002E) as equivalent to the horizontal ellipsis character.
Ссылки на источник, правда, нет...
Цитата: Python от августа 26, 2010, 14:34
Дико люто бешенно бесит кривой кернинг во всех шрифтах: расстояние между точкой под «?» и следующей точкой должно быть равно расстоянию между двумя обычными точками, а не больше.
Ещё один повод добавить новый символ в уникод.
В Юникоде делать им нечего вот и выдумывают всякие псевдознаки. А потом криворукие шрифтоделатели создают дибильное ... которое на вид отличается от ...
Цитата: Тайльнемер от августа 26, 2010, 14:39
Цитата: Python от августа 26, 2010, 14:34
Дико люто бешенно бесит кривой кернинг во всех шрифтах: расстояние между точкой под «?» и следующей точкой должно быть равно расстоянию между двумя обычными точками, а не больше.
Ещё один повод добавить новый символ в уникод.
Скорее уж повод делать нормальные шрифты.
Цитата: Drundia от августа 26, 2010, 14:42
В Юникоде делать им нечего вот и выдумывают всякие псевдознаки. А потом криворукие шрифтоделатели создают дибильное ... которое на вид отличается от ...
У них как раз ясные принципы, вообще-то. "Дебильное" ... добавили для совместимости. А ?.. не добавят (очень надеюсь), ибо шрифты нормальные нужны.
Цитата: Тайльнемер от августа 26, 2010, 14:39
Ещё один повод добавить новый символ в уникод.
Если его добавят, то еще некоторое время он будет отсутствовать во всех шрифтах, Потом появится лишь в редких шрифтах и будет регулярно превращаться в квадратик или (если не попадет в 16-битную зону) в два квадратика. Для регулировки расстояния между двумя отдельными символами нет необходимости расширять юникод вообще.
Дебилизм — это использовать всякую ad hoc фигню вместо нормальных precombined глифов.
А Тёма в данном случае не прав, зане я читала статьи по типографике, где английским языком было написано, что следует использовать ..., а не три точки.
Цитата: Dana от августа 26, 2010, 15:10
где английским языком было написано, что следует использовать ...
В этой книге затрагивались вопросы
русской типографики?
Цитата: Dana от августа 26, 2010, 15:10
Дебилизм — это использовать всякую ad hoc фигню вместо нормальных precombined глифов.
+100
Правда, если честно, будь моя воля, я бы i комбинировал. Из ı. Логично, удобно и вообще. И не было бы всякого идиотизма вроде i + акут = í.
Цитата: Dana от августа 26, 2010, 15:10
А Тёма в данном случае не прав, зане я читала статьи по типографике, где английским языком было написано, что следует использовать ..., а не три точки.
В данном — это в каком? Тут приводились две совершенно противоречивых его цитаты. :)
Цитата: myst от августа 26, 2010, 14:38
Цитата: http://en.wikipedia.org/wiki/Horizontal_ellipsis#Computer_representations
Unicode recognizes a series of three period characters (U+002E) as equivalent to the horizontal ellipsis character.
Ссылки на источник, правда, нет...
Они использовали
equivalent без уточнения, в то время как в уникоде есть понятия
canonical equivalence и
compatibility equivalence.
... и ... именно
compatibility equivalent, что означает, что вообще-то это разные последовательности символов, но ради совместимости чего-то с чем-то их соединили таким специальным отношением.
Цитата: http://en.wikipedia.org/wiki/Unicode_equivalenceThe compatibility equivalence notion is more concerned with plain text equivalence and may lump together some semantically distinct forms.
Цитата: Demetrius от августа 26, 2010, 15:14
Тут приводились две совершенно противоречивых его цитаты.
Где?
Цитата: Demetrius от августа 26, 2010, 15:14
Правда, если честно, будь моя воля, я бы i комбинировал. Из ı. Логично, удобно и вообще. И не было бы всякого идиотизма вроде i + акут = í.
В случае с i, главная проблема — не точка (налепленный поверх нее акут еще кое-как можно отличить от точки), а ширина буквы, из-за чего акут оказывается либо перед і, либо смещенным вправо над всеми буквами, кроме і. Чего юникоду не хватает, так это прекомпозированных букв кириллицы с ударением. Либо четырех серий дополняющих диакритиков, чтобы можно было нормально их расположить над прописными/строчными и нормальными/узкими буквами.
Цитата: Dana от августа 26, 2010, 15:10
Дебилизм — это использовать всякую ad hoc фигню вместо нормальных precombined глифов.
А Тёма в данном случае не прав, зане я читала статьи по типографике, где английским языком было написано, что следует использовать ..., а не три точки.
Мне кажется, что это скорее дело шрифта, а не кодировки. Таким образом, если "." стоит рядом с ",", ".", "?", "!", оба знака могут выглядеть немного иначе. Это сделать совсем не сложно и современные шрифты и редакторы это позволяют.
Цитата: Python от августа 26, 2010, 15:24
В случае с i, главная проблема — не точка (налепленный поверх нее акут еще кое-как можно отличить от точки), а ширина буквы, из-за чего акут оказывается либо перед і, либо смещенным вправо над всеми буквами, кроме і.
В шрифтах эта проблема вполне успешно решается с помощью замен глифов.
Цитата: Hellerick от августа 26, 2010, 14:13
Если у нас нет отдельного знака для «!..»
А зачем в уникоде двуточие?‥
Если эта тема не изменит моего отношения, постараюсь со второго перейти на первое. Пока в состоянии перехода, а в опросе проставил второе.
Цитата: juzare от августа 26, 2010, 15:25
где английским языком было написано
Ну, вы знаете, а французским языком написано, что надо кавычки ставить так: « blah blah ». А, уже Тайльнемер сказал.
Кстати, зачем нужны One dot leaver и two dot leaver, который я обозавл двуточием? Мне кажется, там, где в результате сокращения и точки получаются две точки, надо ставить их отдельными: "..", а в сочетаниях "?‥" и "!‥" использовать двуточие, если его описание этому не противоречит.
Цитата: juzare от августа 26, 2010, 15:25
В шрифтах эта проблема вполне успешно решается с помощью замен глифов.
Которая в половине программ не работает. И потом, о подстановке глифов для кириллицы, как правило, думают в последнюю очередь.
Какой-то зоопарк сущностей. Надо оставлять что-то одно.
Часто ставлю "двоеточие". Недоговоренность не должна затягиваться.
Цитата: Python от августа 26, 2010, 15:24В случае с i, главная проблема — не точка (налепленный поверх нее акут еще кое-как можно отличить от точки), а ширина буквы, из-за чего акут оказывается либо перед і, либо смещенным вправо над всеми буквами, кроме і. Чего юникоду не хватает, так это прекомпозированных букв кириллицы с ударением. Либо четырех серий дополняющих диакритиков, чтобы можно было нормально их расположить над прописными/строчными и нормальными/узкими буквами.
Криворукие шрифтоделатели... и наверняка сама система шрифтоделания и шрифтоотображения. Нужны просто правила и точки привязки и формы. На верхних диакритиках написать что они должны своей определённой нижней центральной точкой прилегать к такой самой определённой верхней центральной точкой предыдущего. Следующий диакритик ставился бы ещё выше и так далее, но почему-то это до сих пор редкость.
Цитата: Drundia от августа 26, 2010, 16:27
Криворукие шрифтоделатели... и наверняка сама система шрифтоделания и шрифтоотображения. Нужны просто правила и точки привязки и формы. На верхних диакритиках написать что они должны своей определённой нижней центральной точкой прилегать к такой самой определённой верхней центральной точкой предыдущего. Следующий диакритик ставился бы ещё выше и так далее, но почему-то это до сих пор редкость.
Да так обычно и делается. Только далеко не везде, но есть, например, тут:
http://www.thessalonica.org.ru/en/fonts-download.html
Цитата: Drundia от августа 26, 2010, 16:27
Криворукие шрифтоделатели... и наверняка сама система шрифтоделания и шрифтоотображения. Нужны просто правила и точки привязки и формы. На верхних диакритиках написать что они должны своей определённой нижней центральной точкой прилегать к такой самой определённой верхней центральной точкой предыдущего. Следующий диакритик ставился бы ещё выше и так далее, но почему-то это до сих пор редкость.
Проблема не только в шрифтах, но и в требованиях к софту, который эти шрифты должен правильно рендерить. В последних версиях библиотек для Джавы есть нечто подобное: диакритики выстраиваются друг над другом. Правда, программа, в которой я мог это чудо наблюдать, и которая была создана раньше этих усовершенствований, после этих нововведений начала дико глючить на моноширинных шрифтах. Пришлось сделать даунгрейд.
В простейшем случае, диакритик — глиф с нулевой печатной шириной и графическим элементом, который накладывается на соседний символ. Дополнительные преобразования (регулировка по высоте, замена комбинаций символов и пр.) требуют более сложного алгоритма отображения.
Цитата: Drundia от августа 26, 2010, 16:27
Нужны просто правила и точки привязки и формы. На верхних диакритиках написать что они должны своей определённой нижней центральной точкой прилегать к такой самой определённой верхней центральной точкой предыдущего.
В действительности все не так просто, как на самом деле. В частности, две точки сверху гласной буквы во французском и в немецком выглядят по-разному. В одном из этих языков они ставятся выше, чем в другом. Вот только не помню, как в каком.
Ой... Неправильно проголосовал :( Можно как-то исправить?
Я всегда использую специальный символ (133), и он есть во всех моих раскладках; а выбрал нечаянно второй пункт...
Цитата: oortВ частности, две точки сверху гласной буквы во французском и в немецком выглядят по-разному. В одном из этих языков они ставятся выше, чем в другом.
Откуда такая интересная инфа?
Вообще, все вопросы о кернинге и взаиморасположении диакритиков — это дело OTF-шрифтов. И вообще всей этой технологии. PostScript — целый язык! — для чего придумали? Java тут как костыль получается. Это текстовые редакторы должны шрифты понимать.
Цитата: Bhudh от августа 26, 2010, 17:31ЦитироватьВ частности, две точки сверху гласной буквы во французском и в немецком выглядят по-разному. В одном из этих языков они ставятся выше, чем в другом.
Откуда такая интересная инфа?
Откуда-то из документации по ТеХу.
Цитата: Тайльнемер от августа 26, 2010, 15:17
Цитата: Demetrius от августа 26, 2010, 15:14
Тут приводились две совершенно противоречивых его цитаты.
Где?
Хм. Да, про другую статью не говорили. Ну, например, тут:
http://web.archive.org/web/20080528234549/http://www.artlebedev.ru/kovodstvo/sections/62/ (http://web.archive.org/web/20080528234549/http://www.artlebedev.ru/kovodstvo/sections/62/)
он перечислял односимвольное многоточие как обязательное у потреблению. В текущей версии статьи этого уже нет.
Цитата: mnashe от августа 26, 2010, 17:23
Можно как-то исправить?
Запросто. Нажмите «удалить голос» под голосовалкой и переголосуйте правильно.
Цитата: Demetrius от августа 26, 2010, 17:36
он перечислял односимвольное многоточие как обязательное у потреблению. В текущей версии статьи этого уже нет.
Видимо его только в июле 2010 г. осенило.
Цитата: Тайльнемер от августа 26, 2010, 19:22
Цитата: mnashe от августа 26, 2010, 17:23
Можно как-то исправить?
Запросто. Нажмите «удалить голос» под голосовалкой и переголосуйте правильно.
Ой, спасибо!
Надо же, как я раньше не замечал!
Цитата: mnashe от августа 26, 2010, 22:01
Цитата: Тайльнемер от августа 26, 2010, 19:22
Цитата: mnashe от августа 26, 2010, 17:23
Можно как-то исправить?
Запросто. Нажмите «удалить голос» под голосовалкой и переголосуйте правильно.
Ой, спасибо!
Надо же, как я раньше не замечал!
Раньше и не встречалось.
Цитата: oort от августа 26, 2010, 17:20
В частности, две точки сверху гласной буквы во французском и в немецком выглядят по-разному. В одном из этих языков они ставятся выше, чем в другом.
И как компьютер должен различать, где французский символ, а где немецкий? Это один и тот же код.
xml:lang="код_языка"
Цитата: Alone Coder от августа 26, 2010, 22:13
И как компьютер должен различать, где французский символ, а где немецкий? Это один и тот же код.
Если не ошибаюсь, и в шрифтах и в текстовых редакторах существует понятие о языке. То есть, если шрифт знает на каком языке пишется текст, то он может по разному отображать глифы (или же вообще разные глифы рисовать).
Цитата: juzareесли шрифт знает на каком языке пишется текст
Шрифт такого точно знать не может.
У вас есть контрол. Вы в него пихаете текст. Наполовину на немецком, наполовину на французском. Там нет никаких тэгов. Откуда компу знать, где что?
Цитата: Bhudh от августа 26, 2010, 22:22
Шрифт такого точно знать не может.
А Вы загляните в редактор шрифтов.
И как там для одного глифа прописывается, где он французский, а где немецкий?
Цитата: Bhudh от августа 26, 2010, 22:26
И как там для одного глифа прописывается, где он французский, а где немецкий?
Я точно не знаю, но то, что можно делать замены глифов только при том или ином языке - такое есть.
Так а что узнаёт, тот или иной там язык: шрифт разве⁈
Цитата: Bhudh от августа 26, 2010, 22:30
Так а что узнаёт, тот или иной там язык: шрифт разве⁈
Renderer.
Во-от.
Цитата: Drundia от августа 26, 2010, 16:27
На верхних диакритиках написать что они должны своей определённой нижней центральной точкой прилегать к такой самой определённой верхней центральной точкой предыдущего. Следующий диакритик ставился бы ещё выше и так далее, но почему-то это до сих пор редкость.
Диакритик над прописной и строчной буквой может иметь различия, не ограничивающиеся расположением. Например, вот здесь акценты над прописными расположены под бóльшим наклоном — для созранения вертикального пространства без потери размера. Следовательно, нужны либо 2 (а в идеале - 4) серии диакритиков, либо подстановка глифов (чем шрифтоделатели будут заниматься в последнюю очередь, а софт в половине случаев не будет догадываться о их стараниях), либо выделение отдельной кодовой позиции в юникоде для каждого знака с ударением.
Цитата: Pythonвыделение отдельной кодовой позиции в юникоде для каждого знака с ударением
Что для латинских глифов (используемых регулярно min в одном языке) уже сделано.
С нерегулярными куда хужее. До сих пор не хотят макрон+акут (∈ долгота+акцент) на отдельные буквы поставить.
А вьетнамские закорюки на этом фоне вообще убивают...