Лингвофорум

Теоретический раздел => Прикладная лингвистика => Тема начата: Γρηγόριος от октября 12, 2016, 11:23

Название: Литера ſh.
Отправлено: Γρηγόριος от октября 12, 2016, 11:23
Возник у меня по вопрос по типографии.
Используется ли отдельная литера для диграфа « ſh », или их печатают раздельно?
Вот пример текста (https://books.google.ru/books?id=Go09AAAAYAAJ&pg=PA293&dq=ship&hl=ru&sa=X&ved=0ahUKEwiC5LCY6dTPAhVGDiwKHW4PCooQ6wEIPTAC#v=onepage&q=ship&f=false).
Название: Литера ſh.
Отправлено: Rwseg от октября 12, 2016, 15:09
В металле набирали единой литерой, для которой было свое место в кассе. Сейчас только отдельно, в Юникоде такой лигатуры нет. При желании можно найти специальный шрифт и использовать Opentype'овский тэг liga.
Название: Литера ſh.
Отправлено: Γρηγόριος от октября 12, 2016, 16:13
Цитата: Rwseg от октября 12, 2016, 15:09
В металле набирали единой литерой, для которой было свое место в кассе. Сейчас только отдельно, в Юникоде такой лигатуры нет. При желании можно найти специальный шрифт и использовать Opentype'овский тэг liga.

Благодарствую, меня интересовала только типографская литера.
Вообще Юникод почему‐то не спешит добавлять лигатуры, при том, что латинская письменность — самая распространённая в мире, например, как нельзя было добавить такую важну лигатуру как ct — непонятно.
Название: Литера ſh.
Отправлено: Rwseg от октября 12, 2016, 16:41
Цитата: Γρηγόριος от октября 12, 2016, 16:13
Вообще Юникод почему‐то не спешит добавлять лигатуры, при том, что латинская письменность — самая распространённая в мире, например, как нельзя было добавить такую важну лигатуру как ct — непонятно.
Их политика (http://unicode.org/faq/ligature_digraph.html#Dig3) против добавления.
Название: Литера ſh.
Отправлено: Γρηγόριος от октября 12, 2016, 17:01
Удивительно, помнится, они хотели представить в Юникоде все сущие и употребляемые буквы, в том числе в познавательных и научных целях, но как, допустим, привести цитату (точную) из вышеуказанного примера? — Никак.
Название: Литера ſh.
Отправлено: Hellerick от октября 12, 2016, 17:42
ЦитироватьZero-width joiner

The zero-width joiner (ZWJ) is a non-printing character used in the computerized typesetting of some complex scripts such as the Arabic script or any Indic script. When placed between two characters that would otherwise not be connected, a ZWJ causes them to be printed in their connected forms.

Кажется, его как раз для таких случаев придумали.
Название: Литера ſh.
Отправлено: Γρηγόριος от октября 12, 2016, 18:09
Тут вопрос не в невозможности пробел реализовать, а в традиции написания.
Название: Литера ſh.
Отправлено: Hellerick от октября 12, 2016, 19:27
Формально здесь нужно поставить подряд три юникодовских символа:

'LATIN SMALL LETTER LONG S' (U+017F)
'ZERO WIDTH JOINER' (U+200D)
'LATIN SMALL LETTER H' (U+0068)

А уже производители шрифтов должны позаботиться, чтобы при этом появлялась нужная вам лигатура.
Название: Литера ſh.
Отправлено: Γρηγόριος от октября 12, 2016, 19:42
Лигатуры являются не чисто формальным объединением нескольких букв, а одним целым, из‐за чего сама графика букв меняется.
Также суща проблема, когда одна буква наезжает на другую; я опопробовал указанный Вами символ в многих шрифтах, но никаких особых подвижек не заметил.
Название: Литера ſh.
Отправлено: Python от октября 12, 2016, 19:59
Насколько я понимаю, латинские типографские лигатуры (к которым относится и ſh) должны при наличии в шрифте подставляться на место составляющих их букв даже при отсутствии джойнера между ними (поскольку такая последовательность букв в данном шрифте отображается в виде лигатуры всегда). Джойнер предназначен для преобразований типа o+e=œ, где две последовательные буквы и лигатура не считаются одним и тем же.
Название: Литера ſh.
Отправлено: Bhudh от октября 12, 2016, 20:07
Так и лигатуры не во всяком случае подставляются...
Название: Литера ſh.
Отправлено: Python от октября 12, 2016, 20:20
Случай, когда подстановка не происходит из-за технических ограничений, не рассматривается. Считается, что подстановка лигатур зависит от языка (допустим, fi в английском преобразуется в лигатуру с потерей точки, а в турецком эту точку следует сохранить) — тем не менее, отдельный джойнер в каждую лигатуру никто не ставит, как и не делает ручную замену букв на лигатуры (хотя лигатура fi включена в юникод) — о подстановке лигатур заботится лишь программа, рендерящая текст.
Название: Литера ſh.
Отправлено: Wolliger Mensch от октября 12, 2016, 21:23
Цитата: Rwseg от октября 12, 2016, 16:41
Цитата: Γρηγόριος от октября 12, 2016, 16:13
Вообще Юникод почему‐то не спешит добавлять лигатуры, при том, что латинская письменность — самая распространённая в мире, например, как нельзя было добавить такую важну лигатуру как ct — непонятно.
Их политика (http://unicode.org/faq/ligature_digraph.html#Dig3) против добавления.

Интересно, почему Григорий диграфы лигатурами называет? :fp:

Хотите лигатуру ſh — держите:

ɦ

;D
Название: Литера ſh.
Отправлено: Python от октября 12, 2016, 22:38
Цитата: Wolliger Mensch от октября 12, 2016, 21:23
Цитата: Rwseg от октября 12, 2016, 16:41
Цитата: Γρηγόριος от октября 12, 2016, 16:13
Вообще Юникод почему‐то не спешит добавлять лигатуры, при том, что латинская письменность — самая распространённая в мире, например, как нельзя было добавить такую важну лигатуру как ct — непонятно.
Их политика (http://unicode.org/faq/ligature_digraph.html#Dig3) против добавления.

Интересно, почему Григорий диграфы лигатурами называет? :fp:

Хотите лигатуру ſh — держите:

ɦ

;D
В данном случае, речь таки о типографической лигатуре, сродни изображенным в правой части рисунка, но образованной из длинного s и h:
(https://upload.wikimedia.org/wikipedia/commons/thumb/f/f3/Ligature_drawing.svg/149px-Ligature_drawing.svg.png)
Да, их называют лигатурами, а не диграфами.
Диграф — две расположенные рядом графические буквы, которые принято читать как одну букву.
Лигатура — знак, представляющий собой графическое слияние двух или более букв, который может, в зависимости от конкретной ситуации, восприниматься как цельная буква (типа немецкой ß или сербской Љ) или как несколько отдельных (латинские лигатуры на рисунке выше, арабские лигатуры и пр.)
Название: Литера ſh.
Отправлено: Wolliger Mensch от октября 12, 2016, 23:26
Ну спасибо за разъяснение. (Старательно конспектирует.)
Название: Литера ſh.
Отправлено: Γρηγόριος от октября 13, 2016, 13:44
Цитата: Wolliger Mensch от октября 12, 2016, 21:23
Цитата: Rwseg от октября 12, 2016, 16:41
Цитата: Γρηγόριος от октября 12, 2016, 16:13
Вообще Юникод почему‐то не спешит добавлять лигатуры, при том, что латинская письменность — самая распространённая в мире, например, как нельзя было добавить такую важну лигатуру как ct — непонятно.
Их политика (http://unicode.org/faq/ligature_digraph.html#Dig3) против добавления.

Интересно, почему Григорий диграфы лигатурами называет? :fp:

Хотите лигатуру ſh — держите:

ɦ

;D

Лигатура есть любое соединение нескольких букв, а диграф есть две буквы между собою соединённые или несоединённые и составляющие при сём некое единое целое в определённом роде.

Аще бы Вы почитали всю нашу беседу, то увидели бы, что я пишу « ſh » вместо « (см. изображение) », потому что нужной лигатуры ſh нет в Юникоде.
Название: Литера ſh.
Отправлено: Wolliger Mensch от октября 13, 2016, 21:04
Цитата: Γρηγόριος от октября 13, 2016, 13:44
Аще бы Вы почитали всю нашу беседу, то увидели бы, что я пишу « ſh » вместо « (см. изображение) », потому что нужной лигатуры ſh нет в Юникоде.

Я вам более естественную лигатуру привёл (пусть в оригинале это не лигатура, а диакритизованная h) для соединения ſ и h. :yes:
Название: Литера ſh.
Отправлено: Python от октября 14, 2016, 12:19
Цитата: Wolliger Mensch от октября 13, 2016, 21:04
Цитата: Γρηγόριος от октября 13, 2016, 13:44
Аще бы Вы почитали всю нашу беседу, то увидели бы, что я пишу « ſh » вместо « (см. изображение) », потому что нужной лигатуры ſh нет в Юникоде.
Я вам более естественную лигатуру привёл (пусть в оригинале это не лигатура, а диакритизованная h) для соединения ſ и h. :yes:
ІМНО слишком глубокое слияние — для данной категории лигатур не очень типично. Хотя, если бы в ɦ было пространство между куском ſ сверху и куском h снизу, получившаяся лигатура построением напоминала бы голландскую U-образную (https://upload.wikimedia.org/wikipedia/commons/thumb/a/a6/%C4%B2_uppercase_ligature.svg/8px-%C4%B2_uppercase_ligature.svg.png) (IJ, IJ) — но в этом случае она читалась бы скорее как ſn
Название: Литера ſh.
Отправлено: Python от октября 14, 2016, 12:37
Да, и верхний завиток в ɦ — разве не от готической H (𝕳) — где там лигатура?
Название: Литера ſh.
Отправлено: Rwseg от октября 15, 2016, 18:33
Цитата: Hellerick от октября 12, 2016, 19:27
Формально здесь нужно поставить подряд три юникодовских символа:

'LATIN SMALL LETTER LONG S' (U+017F)
'ZERO WIDTH JOINER' (U+200D)
'LATIN SMALL LETTER H' (U+0068)

А уже производители шрифтов должны позаботиться, чтобы при этом появлялась нужная вам лигатура.
Вы неправильно советуете. ZWJ нужен только для арабского и индийских. А вставкой этих кодов вы наоборот разрыватете лигатуру и мешаете шрифту/программе правильно отобразить эту лигатуру.

Источник (http://www.unicode.org/L2/L2002/02363-nelson-zwj-zwnj.pdf):
ЦитироватьUsage of optional ligatures such as "fi" is not currently controlled by any codes within the Unicode Standard, but is determined by protocols or resources external to the text sequence.

Чтобы получилась лигатура нужно:
1) Шрифт в формате Opentype, в котором в таблице лигатур есть искомая лигатура.
2) Прорамма, которая может интерпретировать команды Opentype. Обычно это либо бразер, либо текстовый редактор.

В браузере нужно добавить стиль (https://developer.mozilla.org/en/docs/Web/CSS/font-feature-settings).
В редакторах по разному, в LibreOffice так (http://numbertext.org/linux/fontfeatures.pdf) и так (http://extensions.libreoffice.org/extension-center/typography-toolbar).
Название: Литера ſh.
Отправлено: Rwseg от октября 15, 2016, 18:39
Цитата: Python от октября 12, 2016, 19:59
Джойнер предназначен для преобразований типа o+e=œ, где две последовательные буквы и лигатура не считаются одним и тем же.
Совсем нет, читайте выше.
«Преобразования типа o+e=œ» — это замена одних кодов на другие, попросту кодовая подстановка, которая есть в MS Word с давних времён. А вовсе не создание лигатуры. Настоящая лигатура прописана только в шрифте, и при её применении никакие коды не меняются, а лишь меняется визуальное отображение.
Название: Литера ſh.
Отправлено: Rwseg от октября 15, 2016, 18:42
Цитата: Γρηγόριος от октября 12, 2016, 17:01
как, допустим, привести цитату (точную) из вышеуказанного примера?
Если вам реально важна форма, то очень просто — картинкой. Либо PDF с использованием специального шрифта, как указано выше. Либо через стиль веб-страницы и подгружаемый шрифт.
Название: Литера ſh.
Отправлено: Rwseg от октября 15, 2016, 18:53
Цитата: Wolliger Mensch от октября 12, 2016, 21:23
Интересно, почему Григорий диграфы лигатурами называет?
В докомпьютерной типографской терминологии «лигатура» — это кусок металла (литера), на котором выплавлены две (реже три) буквы. Делалось для упрощения набора и из-за эстетических соображений. В отличие от чисто языкового понятия «диграф», лигатуры никакой языковой нагрузки не несли, чистая эстетика (за некоторыми исключениями, но не буду углубляться).
Название: Литера ſh.
Отправлено: Hellerick от октября 15, 2016, 18:59
Цитата: Rwseg от октября 15, 2016, 18:33
Вы неправильно советуете. ZWJ нужен только для арабского и индийских. А вставкой этих кодов вы наоборот разрыватете лигатуру и мешаете шрифту/программе правильно отобразить эту лигатуру.
[...]
Чтобы получилась лигатура нужно:
1) Шрифт в формате Opentype, в котором в таблице лигатур есть искомая лигатура.
2) Прорамма, которая может интерпретировать команды Opentype. Обычно это либо бразер, либо текстовый редактор.

Человеку здесь, насколько я понимаю, нужно не графическое отображение лигатуры.
Ему не нравится то, что средствами Юникода нельзя обозначить, что лигатура была в оригинальном тексте.

То есть, необходимо не просто отыскать шрифт, дающий похожее отображение. Необходимо именно в коде исходного текста еще до того, как к нему были применены какие-то стили форматирования, показать, где эта лигатура стоит, а где не стоит.
Название: Литера ſh.
Отправлено: Rwseg от октября 15, 2016, 19:27
Цитата: Hellerick от октября 15, 2016, 18:59
То есть, необходимо не просто отыскать шрифт, дающий похожее отображение. Необходимо именно в коде исходного текста еще до того, как к нему были применены какие-то стили форматирования, показать, где эта лигатура стоит, а где не стоит.
Смотрите, что у нас получится. Возьмём лигатуру fi. В таблице в шрифте прописано, если после f идёт i, то получается лигатура. Если же мы напечатаем f + ZWJ + i, то этот триггер не сработает. После f не идёт i. Нужен шрифт, который преобразует сочетания «буква + ZWJ + буква» в лигатуры. Но таких шрифтов нет. Сами можете проверить в LibreOffice, как шрифт с тэгом liga реагирует на наличие или отсутствие этого ZWJ между буквами.
Название: Литера ſh.
Отправлено: Rwseg от октября 15, 2016, 19:33
Цитата: Python от октября 14, 2016, 12:37
Да, и верхний завиток в ɦ — разве не от готической H (𝕳) — где там лигатура?
Могу ошибаться, но эту букву придумали где-то в XIX веке, когда придумывали МФА. То есть это не типографская лигатура, которая прибрела потом особое значение (типа как æ œ), а специально выдуманная буква.
Название: Литера ſh.
Отправлено: Hellerick от октября 15, 2016, 20:17
А шрифт и не должен в данном случае своевольно подставлять лигатуру.

Я в данном случае говорю как бы от имени консорциума Юникод, объясняя, почему он никому ничего не должен делать. А то, что на практике ни у кого ничего не получится -- это не моя/Юникода пробема.
Название: Литера ſh.
Отправлено: Wolliger Mensch от октября 15, 2016, 21:20
Цитата: Python от октября 14, 2016, 12:37
Да, и верхний завиток в ɦ — разве не от готической H (𝕳) — где там лигатура?

Ну и как вы читаете сообщения, на которые отвечаете? :what:

Цитата: Wolliger Mensch от октября 13, 2016, 21:04
пусть в оригинале это не лигатура, а диакритизованная h
Название: Литера ſh.
Отправлено: Wolliger Mensch от октября 15, 2016, 21:21
Цитата: Hellerick от октября 15, 2016, 20:17
А шрифт и не должен в данном случае своевольно подставлять лигатуру.

Шрифты никому ничего не подставляют. Подставляет программа :tss:
Название: Литера ſh.
Отправлено: Rwseg от октября 15, 2016, 22:49
Цитата: Hellerick от октября 15, 2016, 20:17
А шрифт и не должен в данном случае своевольно подставлять лигатуру.
Выше сказали, что это задача программы. Но если в самом шрифты не прописаны лигатуры, то программа не поможет.

Цитата: Hellerick от октября 15, 2016, 20:17
Я в данном случае говорю как бы от имени консорциума Юникод, объясняя, почему он никому ничего не должен делать. А то, что на практике ни у кого ничего не получится -- это не моя/Юникода пробема.
Юникод сами объяснили для чего ZWJ. Не для латинских лигатур. Поэтому никто не будет адаптировать программы, чтобы ZWJ действовал так, как вам хотелось бы.
Название: Литера ſh.
Отправлено: Python от октября 15, 2016, 22:53
Цитата: Rwseg от октября 15, 2016, 19:33
Цитата: Python от октября 14, 2016, 12:37
Да, и верхний завиток в ɦ — разве не от готической H (𝕳) — где там лигатура?
Могу ошибаться, но эту букву придумали где-то в XIX веке, когда придумывали МФА. То есть это не типографская лигатура, которая прибрела потом особое значение (типа как æ œ), а специально выдуманная буква.
При выдумывании все равно должен быть какой-то прототип. В данном случае, завиток ɦ вполне мог быть подражанием готической букве.
Название: Литера ſh.
Отправлено: Rwseg от октября 16, 2016, 19:02
Цитата: Python от октября 15, 2016, 22:53
При выдумывании все равно должен быть какой-то прототип. В данном случае, завиток ɦ вполне мог быть подражанием готической букве.
Первый МФА делался по принципу простоты набора и использования литер, которые уже были в шрифтах. Так что скорее всего, внезапно, произошло от лигатуры .
Название: Литера ſh.
Отправлено: Wolliger Mensch от октября 16, 2016, 22:40
Цитата: Rwseg от октября 16, 2016, 19:02
Первый МФА делался по принципу простоты набора и использования литер, которые уже были в шрифтах. Так что скорее всего, внезапно, произошло от лигатуры .

Уточнение: литер, которые были на пишущих машинках. А так как на машинках (полное или частичное) совмещение оттисков не представляет никакой сложности, то все новые буквы МФА образованы либо из небуквенных знаков («2», «?», «!», «:» и т. д.), либо совмещения оттисков. Букву ɦ легко напечатать на машинке, напечатав сначала f, а потом с возвратом картеки на 3/4 — h.
Название: Литера ſh.
Отправлено: Python от октября 16, 2016, 22:46
Но в печатных изданиях могли и комбинировать буквы разных шрифтов. Мода печатать по-немецки готикой тогда еще была актуальна?

В общем, нужно видеть издания с первоМФА, чтобы сказать наверняка.
Название: Литера ſh.
Отправлено: Wolliger Mensch от октября 16, 2016, 23:04
Цитата: Python от октября 16, 2016, 22:46
Но в печатных изданиях могли и комбинировать буквы разных шрифтов. Мода печатать по-немецки готикой тогда еще была актуальна?

В общем, нужно видеть издания с первоМФА, чтобы сказать наверняка.

Судя по кивипедии, ɦ появилась с начала XX века во МФе.
Название: Литера ſh.
Отправлено: Rwseg от октября 17, 2016, 21:13
Цитата: Python от октября 16, 2016, 22:46
В общем, нужно видеть издания с первоМФА, чтобы сказать наверняка.
Прежде чем ответить, я же полдня какое-то время потратил на изучение первоисточников. Единственное, что я с точностью установил: в 1890 этой буквы ещё нет, а в 1900 она уже есть. Значит, появилась она в этот короткий промежуток. Но чтобы узнать, кто эту букву предложил, надо читать тогдашние дискуссии, а конкретно все номера журнала МФА за весь тот период. Которого журнала и в сети почти нет.

Потом меня осенило, что незачем искать, ответ же очевиден.

Цитата: Python от октября 16, 2016, 22:46
Но в печатных изданиях могли и комбинировать буквы разных шрифтов. Мода печатать по-немецки готикой тогда еще была актуальна?
Эту литеру не печатали готикой, и она ничем не отличалась по стилю от других, посмотрите тогдашние примеры МФА.
Название: Литера ſh.
Отправлено: Rwseg от октября 17, 2016, 21:37
Цитата: Wolliger Mensch от октября 16, 2016, 22:40
Уточнение: литер, которые были на пишущих машинках.
Печатные машинки в 1890-каком-то-там году? Они ещё только появились и начали распространятся, никто не думал под них подстраиваться. Рукописи тогда реально были рукописями, посмотрите какое внимание уделяли также рукописной форме МФА.
Подстраивались именно под возможности типографий. Понятно, что при желании можно было заказать любые буквы, до МФА какие только проекты фонетических алфавитов не предлагали с самыми вычурными буквами, но ведь суть МФА была именно в универсализации и упрощении. Почти все дополнительные буквы МФА создавались либо поворотом латинских букв, либо использованием заглавных, либо заимствованием из греческого, то есть того, что меньше создаст проблем типографиям. Потом, конечно, уже начали не ограничивать себя и проявлять фантазию.

Конечно, я не против согласиться, если вы найдёте реальных пример МФА тех времен, сделанный на печатной машинке.

Цитата: Wolliger Mensch от октября 16, 2016, 22:40
все новые буквы МФА образованы либо из небуквенных знаков («2», «?», «!», «:» и т. д.), либо совмещения оттисков.
Не соображу, какой знак мог произойти от двойки, но /ʔ/ от разросшегося апострофа из транскрипции египтологов. /ː/ придумали до распространения машинок. А всякие клики (/ǃ/, /ǂ/) скорее всего да, пошло от африканистов, которые печатали на машинках, но это уже XX век.

Цитата: Wolliger Mensch от октября 16, 2016, 22:40
Букву ɦ легко напечатать на машинке, напечатав сначала f, а потом с возвратом картеки на 3/4 — h.
Сдвиг каретки на 3/4? Как вы себе это представляете?  :what: Вы на машинке печатали?
Название: Литера ſh.
Отправлено: Wolliger Mensch от октября 17, 2016, 22:21
Цитата: Rwseg от октября 17, 2016, 21:37
Сдвиг каретки на 3/4? Как вы себе это представляете?  :what: Вы на машинке печатали?

Да, семь лет. Сначала на механической «Москве», потом на электронной «Ромашке». А вот вы не печатали, раз не знаете элементарных приёмов.
Название: Литера ſh.
Отправлено: Rwseg от октября 18, 2016, 00:46
Цитата: Wolliger Mensch от октября 17, 2016, 22:21
Да, семь лет. Сначала на механической «Москве», потом на электронной «Ромашке». А вот вы не печатали, раз не знаете элементарных приёмов.
Печатал на электромеханической.
Но я понял, что вы имеете ввиду. Я даже и не задумывался, что можно/нужно каретку на доли шага сдвигать (тем более назад), ведь зачем? Да и не очень удобно, слишком тонкие движения.
Название: Литера ſh.
Отправлено: Γρηγόριος от апреля 7, 2017, 20:57
Цитата: Rwseg от октября 15, 2016, 18:33
ZWJ нужен только для арабского и индийских.

Отнюдь, например в шрифте Quivira, чтобы соединить несколько верхних линий над символами в одну, требуется между буквами вставить ZWJ: V̅‍I̅‍I̅‍I̅DCL, но не V̅I̅I̅I̅DCL.
Ещё:
(http://www.picshare.ru/uploads/170407/c1JVe207Wk.png) (http://www.picshare.ru/view/8024854/)
ᲄв и ᲄ‍в.

P. S. Для словенского языка использован шрифт «Ponomar Unicode».