Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Юникод отстой

Автор Nevik Xukxo, октября 17, 2011, 15:39

0 Пользователи и 1 гость просматривают эту тему.

Тайльнемер

Цитата: Искандер от октября 19, 2011, 14:57
самое смешное, что по логике шрифта как такового для турецкого ı и базового элемента î ï í ì должны использоваться разные глифы.
Я понимаю глифы как чисто визуальную форму, не имеющую прямого отношения к коду символа. Вы нет?

Demetrius

Цитата: Искандер от октября 19, 2011, 14:57
Цитата: Demetrius от октября 19, 2011, 12:20
При чём комбинируемая диакритика к кернингу?
В том, что это работает только с ненулевым кернингом разумеется, вы вообще говоря процесс набора текста представляете вгде?
На компьютере. А Вы где?

Что мешает не учитывать диакритику при рассчете кернинговых пар? Религия? Любовь к устаревшим технологиям?

Тогда давайте вообще комбинированные символы не использовать, ведь в формате fnt они не поддерживаются.

Цитировать
Цитата: Demetrius от октября 19, 2011, 12:20
По уникоду прекомбы и символы с комбинируемой диакритикой должны выглядеть одинаково. В том числе и их кернинг. То, что на некоторых реализациях уникода они выглядят по-разному—это есть неполная реализация уникода.

А неполные они именно из-за монстрообразности. А монстрообразность в том числе из-за прекомбов.
Так вот неполная реализация возможностей шрифтов радует нас во всех вообще програмных продуктах этих наших имбицилов. И это печально, да.
Но.
Смысл последнего предложения от меня старательно ускользает.
Не во всех. А OpenType на что?

Смысл последнего: в уникоде есть два способа сделать одно и то же. Разработчики ПО и шрифтов не могут отшлифовать сразу две вещи, поэтому выбирают что-то одно.

Был бы только один путь, все шли бы им. И была бы у нас нормальная поддержка комбинируемой диакритики.

Цитировать
Цитата: Тайльнемер от октября 19, 2011, 12:53
Что касается i, то я бы сделал так:

Диакритика только комбинированная, за исключением не-турецкого i, то есть:
самое смешное, что по логике шрифта как такового для турецкого ı и базового элемента î ï í ì должны использоваться разные глифы. Самое логичное -- кодировать их разными кодами.
А есть шрифты, где они различаются?

Тайльнемер

Цитата: Vertaler от октября 19, 2011, 13:36
β) Перерисовку символа ỉ,
γ) добавление новых, правильных ìÌ íÍ ĩĨ. На этот раз уже с маюскулами.
Добавление куда?
Для них же не надо будет выделять отдельные коды.

Искандер

Цитата: Тайльнемер от октября 19, 2011, 15:08
Я понимаю глифы как чисто визуальную форму, не имеющую прямого отношения к коду символа. Вы нет?
Тут Деметриус мечется в панике с воплями о сложности и навороченности. Конешно оно будет сложнонавороченно, если на каждый код в зависимости от окружения и бог знает чего ещё нужно будет подбирать глифы из 100500 вариантов.

Цитата: Demetrius от октября 19, 2011, 15:13
Что мешает не учитывать диакритику при рассчете кернинговых пар? Религия? Любовь к устаревшим технологиям?
М... мешает то обстоятельство, что если не учитывать кернинг пары буква+комбодиакритик — выйдет не буква, а говно.

Цитата: Demetrius от октября 19, 2011, 15:13
А есть шрифты, где они различаются?
Вот нужно взять турецко-французских словарей 189х гг издания и полуркать...
Токо их у нас... нет
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Vertaler

Цитата: Hellerick от октября 19, 2011, 14:15
Цитата: Vertaler от октября 19, 2011, 13:36
В смысле, что точка по понятиям должна сохраняться у минускула под диакритиками.

На практике это сейчас реализуется?
Пруф бы.
А вот тут заминка. Традиционное начертание — с точкой. Во вьетнамской библиотеке РГГУ есть старые книги с такой орфографией. Но чем новее — тем реже. Мои оба словаря неопределённого, но явно старого и истрёпанного года издания — без точек.
Стрч прст в крк и вынь сухим.

Vertaler

Цитата: Тайльнемер от октября 19, 2011, 15:24
Цитата: Vertaler от октября 19, 2011, 13:36
β) Перерисовку символа ỉ,
γ) добавление новых, правильных ìÌ íÍ ĩĨ. На этот раз уже с маюскулами.
Добавление куда?
Для них же не надо будет выделять отдельные коды.
Надо будет. Маленькую і с вопросиком придётся просто перерисовать, а ìíĩ встречаются в других языках, поэтому варианты с точкой нужно будет создать отдельно. Ну и маюскулы к ним — для правильного преобразования.
Стрч прст в крк и вынь сухим.

Demetrius

(Искандеру)
Валентин Н, перелогиньтесь.

Объясняю популярно. Если надо рассчитать кернинг для строки из n символов, причем символы от 2-го до (n-1)-ого являются диакритикой, то нужно брать кернинговую пару первого и n-ного элемента.

Программно такое реализуется запросто.

Тайльнемер

Кажется под кернингом Искандер имеет в виду положение диакритика относительно буквы.

Demetrius

Цитата: Тайльнемер от октября 19, 2011, 16:30
Кажется под кернингом Искандер имеет в виду положение диакритика относительно буквы.
Вряд ли. Такое никто кернингом не называет.

По-моему Искандер просто банально абсолютизирует ограничения существующих программ.

Искандер

Цитата: Demetrius от октября 19, 2011, 16:15
Объясняю популярно. Если надо рассчитать кернинг для строки из n символов, причем символы от 2-го до (n-1)-ого являются диакритикой, то нужно брать кернинговую пару первого и n-ного элемента.
Цитата: Тайльнемер от октября 19, 2011, 16:30
Кажется под кернингом Искандер имеет в виду положение диакритика относительно буквы.
Цитата: Demetrius от октября 19, 2011, 16:45
Вряд ли. Такое никто кернингом не называет.
предлагаете называть это "таким"
хорошо. тогда в вашей терминологии наличие пары буква+комбайн-диакритика требует применения такого, впринципе это правильно и надо уходить от прекомбов, где такое уже учтено и не требуется, но эти чортовы людишки не хотят учиться и не умеют правильно применять такое.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Искандер

Цитата: Demetrius от октября 19, 2011, 16:45
По-моему Искандер просто банально абсолютизирует ограничения существующих программ.
диакритика вечно ползёт. Я не виноват. Даже в ЛаТеКсе, ползёт.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Demetrius

Ну так положение диакритики надо рассчитывать относительно первого символа.


А насчет ползущей... Ну не знаю, можно сделать разные кернинговые пары: одни для spacing characters, другие для комбинирующихся (причем для комбинирущихся предусмотреть еще и сдвиг по вертикали). :donno: Такого нигде нет AFAIK, но что мешает запилить свой формат шрифтов впридачу?

На худой конец можно рассматривать частые сочетания буква+диакритика как лигатуры. Существующие системы такое позволяют. Хотя это, конечно, полумера.

Но вообще, чем меньше система, тем больше шансов, что ее проработают хорошо.

Bhudh

Цитата: Hellerick от Тайльнемер имеет наглость публиковать мои мысли.
У меня вообще иногда такое ощущение, что это не два разных человека...
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Тайльнемер

Цитата: Demetrius от октября 19, 2011, 17:33
Ну не знаю, можно сделать разные кернинговые пары: одни для spacing characters, другие для комбинирующихся (причем для комбинирущихся предусмотреть еще и сдвиг по вертикали). Такого нигде нет AFAIK
А как реализовано в существующих шрифтах правильное выстраивание диакритиков друг над другом?

Тайльнемер

Цитата: Bhudh от октября 19, 2011, 17:43
У меня вообще иногда такое ощущение что это не два разных человека...



А я всё время путаю Dēmētrius'а и Hellerick'а.

Demetrius

Цитата: Тайльнемер от октября 19, 2011, 17:43
Цитата: Demetrius от октября 19, 2011, 17:33
Ну не знаю, можно сделать разные кернинговые пары: одни для spacing characters, другие для комбинирующихся (причем для комбинирущихся предусмотреть еще и сдвиг по вертикали). Такого нигде нет AFAIK
А как реализовано в существующих шрифтах правильное выстраивание диакритиков друг над другом?
Кстати не знаю. Может, OpenType такое и делает. :donno:

Vanilla TrueType такое точно не умеет.

Bhudh

Цитата: Тайльнемер от А я всё время путаю Dēmētrius'а и Hellerick'а.
Как можно китаиста с японистом путать?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Искандер

Цитата: Тайльнемер от октября 19, 2011, 17:43
выстраивание диакритиков друг над другом?
Вообще таемница есть.
По идее ограничений быть не должно, кроме чисто эстетико-геометрических. Но таки существуют конешно традиции, облегчающие чтение.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Hellerick

Цитата: Bhudh от октября 19, 2011, 17:54
Цитата: Тайльнемер от А я всё время путаю Dēmētrius'а и Hellerick'а.
Как можно китаиста с японистом путать?
Ой, а хто эти люди? :o

Тайльнемер

Цитата: Vertaler от октября 19, 2011, 16:13
Традиционное начертание — с точкой. Во вьетнамской библиотеке РГГУ есть старые книги с такой орфографией. Но чем новее — тем реже. Мои оба словаря неопределённого, но явно старого и истрёпанного года издания — без точек.
Тогда никаких проблем. Вводим буквы:
(7) i — LATIN SMALL LETTER OLD VIETNAMESE I
(8) I — LATIN CAPITAL LETTER OLD VIETNAMESE I
которые нужным образом сочетаются со всеми нужными диакритиками, и забываем про них.
А в современном вьетнамском используем обычные (1)i и (2)I.

Hellerick

Offtop
Я всех со всеми путаю.

Если не считать нескольких выдающихся (обычно, в плохом смысле) личностей, у меня не формируется представление о «характере» отдельных форумчан. Есть массив ников, есть массив сообщений, но друг с другом они почти не ассоциируются.

Hellerick

Цитата: Тайльнемер от октября 19, 2011, 18:00
(7) i — LATIN SMALL LETTER OLD VIETNAMESE I
(8) I — LATIN CAPITAL LETTER OLD VIETNAMESE I

В таком специфическом случае можно и многоэтажной диакритикой обойтись. И плевать, что связь между заглавной и маленькой буквой нелогична. Повторяю, случай же специфический. В реале от него ни холодно, ни жарко.

Тайльнемер

Цитата: Hellerick от октября 19, 2011, 18:07
В таком специфическом случае можно и многоэтажной диакритикой обойтись. И плевать, что связь между заглавной и маленькой буквой нелогична. Повторяю, случай же специфический. В реале от него ни холодно, ни жарко.
Точно.

Тайльнемер

Если отказываться от комбинированной диакритики, то возникает проблема: что считать диакритикой, а что нет. Особенно непонятно в неславянских кириллицах.

Hellerick

Цитата: Тайльнемер от октября 19, 2011, 18:34
Если отказываться от комбинированной диакритики, то возникает проблема: что считать диакритикой, а что нет. Особенно непонятно в неславянских кириллицах.

А в славянских проще? Ё, Й, Ї? Русам-украм будет трудно объяснить, почему этим буквам не выделили отдельный код.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр