Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.
Ограничения: максимум вложений в сообщении — 3 (3 осталось), максимальный размер всех файлов — 300 КБ, максимальный размер одного файла — 100 КБ
Снимите пометку с вложений, которые необходимо удалить
Перетащите файлы сюда или используйте кнопку для добавления файлов
Вложения и другие параметры
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр

Сообщения в этой теме

Автор Demetrius
 - октября 20, 2015, 11:57
Цитата: Demetrius от октября 20, 2015, 11:40
Насколько я понимаю, нет.
Я зря тут дал ответ «нет», т.к. неясно, что вы понимаете под квадратностью. Но о слиянии речь не идёт, т.к. «неслитых» форм в принципе не было, НЯП.
Автор Demetrius
 - октября 20, 2015, 11:40
Цитата: Alone Coder от октября 20, 2015, 10:04
Когда китайские иероглифы стали квадратными? Какой в этом был смысл до изобретения подвижных литер (по официальной истории в XI веке)?
Зависит от того, что Вы понимаете под «квадратными».

— Если общую тенденцию к прямоугольным линиям и избеганию кругов, то это, действительно, было в письме 隸書 dàisyū (лишу; clerical script), которое действительно связывают с появлением бамбуковых дощечек.

— Если под «квадратными» понимается вписанность в квадрат, то в дайсю они ещё были вписаны не в квадрат, а в прямоугольник (высота была меньшей, чем ширина; это экономило место на бамбуковых дощечках). В более поздних стилях они квадратные, но и в более ранних, наверное, можно найти такие, пропорции которых стремились к квадрату.

— Если имеется в виду вписанность иероглифа в прямоугольник, при котором сравнительно легко выделить границы символов, то что-то такое можно найти уже в чжоуских гадательных надписях (пусть и не очень аккуратно):


Цитата: Alone Coder от октября 20, 2015, 10:04
Можно предположить, что иероглифы типа [12] слились в один до того, как стали квадратными. Так ли это?
Насколько я понимаю, нет. Иероглифы типа [12] в древнейших надписях писались обычно только с фонетическим компонентом, т.е. вместо [12] писали 2 (или 1), а добавление семантических компонентов происходило позже для уточнения, и с сохранением вписанности в прямоугольник.

Цитата: Alone Coder от октября 20, 2015, 10:21
Однако египтяне, которые тоже писали на тростнике, имели неквадратные иероглифы.
У них язык был другой. У египтян слова часто были в несколько слогов, тогда как у китайцев почти всегда в один (сейчас, правда, говорят о полутораслогах, т.е. были слова в два слога, где первый редуцированный, но это картины не меняет). В результате у египтян не было соответствия «один знак — один слог [или полутораслог]» и не было нужды, добавляя новые детерминативы, вписывать их внутрь существующего символа.

Цитата: Alone Coder от октября 20, 2015, 10:21
И монголы, которые тоже писали вертикально, не старались отделять символы или делать их одной высоты...
У этих письменность вообще по другому принципу построена.
Автор mnashe
 - октября 20, 2015, 10:35
Цитата: Hellerick от мая 22, 2015, 18:27
Раньше иногда практиковалось разбиение иероглифов пополам, и кодирование каждой половины, например в виде ячейке 8x16, отдельно. Так экономилась куча позиций.
Может, это делалось не столько для экономии позиций, сколько для вписывания в удобный технический стандарт (по одному байту на строку растра)?
Я понимаю, что текстовый режим всё равно неприменим (в 512 позиций никак не впишешься), но думаю, что и в графических режимах до появления Windows старались использовать восьмипиксельные символы.
Автор Hellerick
 - октября 20, 2015, 10:25
У египтян был папирус без особых ограничений по площади.
У монголов была алфавитная письменность. Если символов не так много, то в них труднее запутаться.
Автор Alone Coder
 - октября 20, 2015, 10:21
Однако египтяне, которые тоже писали на тростнике, имели неквадратные иероглифы. И монголы, которые тоже писали вертикально, не старались отделять символы или делать их одной высоты...
Автор Hellerick
 - октября 20, 2015, 10:15
Я так понимаю, иероглифы предназначены для рисования на бамбуковых дощечках.



Ширина дощечек определяет ширину иероглифа. Высота иероглифа была стандартизирована, чтобы четче понимать, где кончается один, и начинается другой иероглиф. Ну а потом просто для того, чтобы красивше было.
Автор Alone Coder
 - октября 20, 2015, 10:04
Когда китайские иероглифы стали квадратными? Какой в этом был смысл до изобретения подвижных литер (по официальной истории в XI веке)?
Можно предположить, что иероглифы типа [12] слились в один до того, как стали квадратными. Так ли это?
Автор Demetrius
 - июля 30, 2015, 02:17
Цитата: Alone Coder от мая 22, 2015, 15:31
1. Какой набор иероглифов полностью достаточен для написания в принципе произвольных текстов?
Никакой. Это открытая система. А вообще, иероглифы за пределами базовой плоскости уникода Уникода почти не встречаются.

Цитата: Alone Coder от мая 22, 2015, 15:31
2. Что делать с остальными иероглифами? Как принято поступать в таких случаях?
Я видел где-то в интернете Шаньхайцзин, где отсутствующие иероглифы заменялись на что-то типа [上X下Y]. Но это древний текст, где очень важно сохранить иероглиф. В обычных текстах вполне можно просто заменить омонимом (果 вместо 嗰), а то и вообще латиницей (D вместо 啲). В кантонском ещё компонент «рот» часто заменяют на o (o的 вместо 啲).

Цитата: Alone Coder от мая 22, 2015, 15:31
3. Реально ли сэкономить за счёт разделения иероглифов на элементы?
Да.

Цитата: Alone Coder от мая 22, 2015, 15:31
4. Реально ли сэкономить за счёт более мелких рисунков? (Мельче 12x12 не видел.)
Нет. Довольно быстро большинство иероглифов становятся нечитаемыми.

Цитата: Hellerick от мая 23, 2015, 12:30
Ну да, всё уже придумано до нас. По-хорошему, надо максимально полно Cangjie воспроизводить.
Я бы не советовал. Цанцзе сильно привязан к тому, что это система ввода, и поэтому он больше оптимизирован для ввода, чем для программного вывода.

Цитата: Alone Coder от июля 18, 2015, 23:38
Тут бы найти простой и нежручий метод, который покрывает подавляющее большинство случаев.
Мне кажется, что имело бы смысл взять базу разбиений (тыц, тыц) и написать скрипт, который найдёт максимально эффективное разбиение. Проблема в том, что разбиения не всегда в пропорции 1:1 (для самых частых компонентов это что-то типа 1:2).

Ещё мне кажется лишним кодировать сразу и упрощённые, и традиционные. Всё равно конкретный человек обычно предпочитает либо те, либо те. Поэтому брать те начертания, которые использует целевая аудитория.

Цитата: Тайльнемер от июля 15, 2015, 09:52
А, то есть, рекурсивно.
Оно рекурсивно только в одну сторону. При переходе от формы к коду мы разбиваем иероглиф рекурсивно. При рисовании знака по коду у нас рекурсии нет, нужно составлять таблицы.

Мы разбиваем основной иероглиф по основному разбиению (снаружи внутрь; если нельзя, то снизу вверх; если нельзя, то слева направо). Если разбиение даёт два компонента, то от первого берётся два знака, от второго — три (說 YRCRU/卜口金口山  = 言 Y[MM]R/卜[一一]口 + 兌 CR[H]U/金口[竹]山). Если есть три явных компонента, то 2 + 2 + 1 (謝 YRHHI = 言 Y[MM]R + 身 + H[X]H + 寸 [D]I). Если какой-то компонент сам по себе неделимый, то на другие будет больше места (как в случае с 鬱, где «крышка» между 木缶木 и 鬯彡 пишется одной буквой — B/月, поэтому имеем 2+1+2).

Таким образом, в вашем примере:
鬱 DDBUH = 木缶木 D[OJU]D + крышка B + 鬯彡 U[PHH]H
Иероглифа [鬯彡] нет, но если бы он был, он бы писался UPHHH = 鬯 UP + 彡 HHH
彡 естественным образом разбивается на HHH
鬯 UIP = обрамление снизу U  + I[???]I + ヒ P — тут я даже не знаю, как его разбить

Таким образом, при вводе в компьютер мы разбираем иероглифы рекурсивно. При выводе — не рекурсивно. Из DDBUH никак не узнаешь, что DD — это на самом деле DJOUD.
Автор Alone Coder
 - июля 18, 2015, 23:38
Единичные исключения можно рисовать картинкой. Тут бы найти простой и нежручий метод, который покрывает подавляющее большинство случаев.
Автор Rwseg
 - июля 17, 2015, 22:57
Цитата: Hellerick от июля 15, 2015, 08:39
Цитата: https://en.wiktionary.org/wiki/鬱鬱 (radical 192 鬯+19, 29 strokes, cangjie input 木木月山竹 (DDBUH), four-corner 44722, composition ⿳⿲木缶木冖⿰鬯彡)
Пришлось увеличить масштаб в браузере до 300%, чтобы рассмотреть первый и второй иероглифы. :fp: Как раз такие вещи от китайского и отталкивают. :(