Цитата: Hellerick от июля 18, 2012, 12:43Не знаю. Я думал так, хотя не знаю.
Что делать с парами прописная-строчная буква? Всегда и всюду следовать порядку AaBbCc и т.д.?
Цитата: Hellerick от июля 18, 2012, 12:38Цитата: Bhudh от июля 18, 2012, 12:33На два чего?
Поццему не на 2?
Этот «трезубец» разве является отдельной графемой?
Цитата: Bhudh от июля 18, 2012, 12:33На два чего?
Поццему не на 2?
Цитата: Bhudh от июля 18, 2012, 12:33На совести Грувера. Впрочем, иероглиф редкий и никому не нужный.
Поццему не на 2?
Цитата: Тайльнемер от июля 18, 2012, 10:40Не думаю, что проще. С моим подходом задача «прочитать одну букву» делается достаточно просто — «прочитать всю диакритику [т.е. символы с кодом больше определённого числа] аж до не-диакритика» (или, если делать диакритику после символа, как в уникоде, то «прочитать один не-диакритик и всю диакритику вплоть до следующего не-диакритика»; но тогда нужен lookahead).
Правильно ли я понимаю, что вы предлагаете для каждого простого иероглифа (типа 口) ввести помимо основного код-пойнта ещё несколько дополнительных код-пойнтов, содержащих тот же иероглиф в роли диакритики того или иного типа?
Если так, то не проще ли выделить несколько код-пойнтов, обозначающих только тип диакритики, или тип разложения иероглифа на части, и представлять иероглиф в виде этого маркера типа и составных частей?
Цитата: Тайльнемер от июля 18, 2012, 10:40Не знаю. Я ни в зуб ногой в корейском.
Кстати, как бы вы разложили хангыль?
Цитата: fujhi от июля 17, 2012, 12:00Я ничего не понимаю в китайском
То есть введение одного только символа <комбинирующаяся трёхточечная вода слева> может сократить количество требуемых кодовых мест на 2497! (Хотя дальше выгода будет меньшей. Например, если ввести <комбинируемую 去 справа>, то в иероглифе 法 всё равно будет использоваться обычная 去.)
Выбрать, что будет выносится в комбинирующуюся диакритику, предлагаю статистически — если элемент используется в какой-то роли в N или более иероглифах, то ему выделяется соответствующий код.
Страница создана за 0.039 сек. Запросов: 21.