Цитата: Demetrius от октября 20, 2015, 11:40Я зря тут дал ответ «нет», т.к. неясно, что вы понимаете под квадратностью. Но о слиянии речь не идёт, т.к. «неслитых» форм в принципе не было, НЯП.
Насколько я понимаю, нет.
Цитата: Alone Coder от октября 20, 2015, 10:04Зависит от того, что Вы понимаете под «квадратными».
Когда китайские иероглифы стали квадратными? Какой в этом был смысл до изобретения подвижных литер (по официальной истории в XI веке)?
Цитата: Alone Coder от октября 20, 2015, 10:04Насколько я понимаю, нет. Иероглифы типа [12] в древнейших надписях писались обычно только с фонетическим компонентом, т.е. вместо [12] писали 2 (или 1), а добавление семантических компонентов происходило позже для уточнения, и с сохранением вписанности в прямоугольник.
Можно предположить, что иероглифы типа [12] слились в один до того, как стали квадратными. Так ли это?
Цитата: Alone Coder от октября 20, 2015, 10:21У них язык был другой. У египтян слова часто были в несколько слогов, тогда как у китайцев почти всегда в один (сейчас, правда, говорят о полутораслогах, т.е. были слова в два слога, где первый редуцированный, но это картины не меняет). В результате у египтян не было соответствия «один знак — один слог [или полутораслог]» и не было нужды, добавляя новые детерминативы, вписывать их внутрь существующего символа.
Однако египтяне, которые тоже писали на тростнике, имели неквадратные иероглифы.
Цитата: Alone Coder от октября 20, 2015, 10:21У этих письменность вообще по другому принципу построена.
И монголы, которые тоже писали вертикально, не старались отделять символы или делать их одной высоты...
Цитата: Hellerick от мая 22, 2015, 18:27Может, это делалось не столько для экономии позиций, сколько для вписывания в удобный технический стандарт (по одному байту на строку растра)?
Раньше иногда практиковалось разбиение иероглифов пополам, и кодирование каждой половины, например в виде ячейке 8x16, отдельно. Так экономилась куча позиций.
Цитата: Alone Coder от мая 22, 2015, 15:31Никакой. Это открытая система. А вообще, иероглифы за пределами базовой плоскости уникода Уникода почти не встречаются.
1. Какой набор иероглифов полностью достаточен для написания в принципе произвольных текстов?
Цитата: Alone Coder от мая 22, 2015, 15:31Я видел где-то в интернете Шаньхайцзин, где отсутствующие иероглифы заменялись на что-то типа [上X下Y]. Но это древний текст, где очень важно сохранить иероглиф. В обычных текстах вполне можно просто заменить омонимом (果 вместо 嗰), а то и вообще латиницей (D вместо 啲). В кантонском ещё компонент «рот» часто заменяют на o (o的 вместо 啲).
2. Что делать с остальными иероглифами? Как принято поступать в таких случаях?
Цитата: Alone Coder от мая 22, 2015, 15:31Да.
3. Реально ли сэкономить за счёт разделения иероглифов на элементы?
Цитата: Alone Coder от мая 22, 2015, 15:31Нет. Довольно быстро большинство иероглифов становятся нечитаемыми.
4. Реально ли сэкономить за счёт более мелких рисунков? (Мельче 12x12 не видел.)
Цитата: Hellerick от мая 23, 2015, 12:30Я бы не советовал. Цанцзе сильно привязан к тому, что это система ввода, и поэтому он больше оптимизирован для ввода, чем для программного вывода.
Ну да, всё уже придумано до нас. По-хорошему, надо максимально полно Cangjie воспроизводить.
Цитата: Alone Coder от июля 18, 2015, 23:38Мне кажется, что имело бы смысл взять базу разбиений (тыц, тыц) и написать скрипт, который найдёт максимально эффективное разбиение. Проблема в том, что разбиения не всегда в пропорции 1:1 (для самых частых компонентов это что-то типа 1:2).
Тут бы найти простой и нежручий метод, который покрывает подавляющее большинство случаев.
Цитата: Тайльнемер от июля 15, 2015, 09:52Оно рекурсивно только в одну сторону. При переходе от формы к коду мы разбиваем иероглиф рекурсивно. При рисовании знака по коду у нас рекурсии нет, нужно составлять таблицы.
А, то есть, рекурсивно.
Цитата: Hellerick от июля 15, 2015, 08:39Пришлось увеличить масштаб в браузере до 300%, чтобы рассмотреть первый и второй иероглифы. Как раз такие вещи от китайского и отталкивают.Цитата: https://en.wiktionary.org/wiki/鬱鬱 (radical 192 鬯+19, 29 strokes, cangjie input 木木月山竹 (DDBUH), four-corner 44722, composition ⿳⿲木缶木冖⿰鬯彡)
Страница создана за 0.079 сек. Запросов: 22.