Лингвофорум

Теоретический раздел => Прикладная лингвистика => Вопросы письменности => Тема начата: Γρηγόριος от июня 10, 2016, 22:55

Название: Кириллица в Юникоде.
Отправлено: Γρηγόριος от июня 10, 2016, 22:55
А начну я с буквы под названием « Cyrillic Letter Neutral Yer »: . Кто знает зачем нужна сия буква? Может для одноеровых рукописей?
Название: Кириллица в Юникоде.
Отправлено: Bhudh от июня 10, 2016, 23:16
Цитата: http://www.unicode.org/L2/L2007/07003r-n3194r-cyrillic.pdfNEUTRAL YER Ꙏꙏ is used in transcribing documents where it is impossible to tell the difference between Ъъ and Ьь (a common situation in late medieval Russian archival materials). See Figure 27.
Цитата: Figure 27

Figure 27. Sample from Котков & Тарабасова 1965, showing NEUTRAL YER and MONOGRAPH UK.
Название: Кириллица в Юникоде.
Отправлено: Γρηγόριος от июня 10, 2016, 23:40
Не ял, какую такую разность оный выражает. Объясните?
Название: Кириллица в Юникоде.
Отправлено: Bhudh от июня 11, 2016, 00:20
Вы английского не знаете?

Цитата: OK, переводНЕЙТРАЛЬНЫЙ ЕР Ꙏꙏ используется при транскрипции документов, в которых невозможно передать разницу между Ъъ и Ьь (частый случай в позднесредневековых русскоязычных архивных материалах).
Название: Кириллица в Юникоде.
Отправлено: Bhudh от июня 11, 2016, 00:23
Не понимаю вопроса вообще, кстати.
Вы думаете, в Уникод его руководители просто так, от балды всё суют? Там на каждый символ каждой версии > 1.1 есть proposal (то бишь представление на включение), на некоторые даже не один, и все они на сайте Уникода выложены.
И далеко не всякий proposal удовлетворяется, кстати. А если и, то далеко не сразу. Можно даже статистику набрать по интервалу приёма.
Название: Кириллица в Юникоде.
Отправлено: Lodur от июня 11, 2016, 02:38
«Вомотъренье»? :what: :uzhos:
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июня 11, 2016, 07:52
Цитата: Lodur от июня 11, 2016, 02:38
«Вомотъренье»? :what: :uzhos:

Что не так?
Название: Кириллица в Юникоде.
Отправлено: Γρηγόριος от июня 11, 2016, 08:21
Цитата: Bhudh от июня 11, 2016, 00:20
Вы английского не знаете?

Цитата: OK, переводНЕЙТРАЛЬНЫЙ ЕР Ꙏꙏ используется при транскрипции документов, в которых невозможно передать разницу между Ъъ и Ьь (частый случай в позднесредневековых русскоязычных архивных материалах).

Приставку im мимо очей пропустил ::)

Но для меня всё равно сие не понятно. Что же значит, например, нейтральный ер в овом слове « милосꙏть »?
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июня 11, 2016, 09:09
Цитата: Γρηγόριος от июня 11, 2016, 08:21
Но для меня всё равно сие не понятно. Что же значит, например, нейтральный ер в овом слове « милосꙏть »?

Сокращённая запись, чтобы не писать милос{ь/ъ}т.
Название: Кириллица в Юникоде.
Отправлено: Lodur от июня 11, 2016, 09:25
Цитата: Wolliger Mensch от июня 11, 2016, 07:52Что не так?
Не встречал никогда корня -мотр- с этой приставкой, не могу понять, что он с ней должен означать.
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июня 11, 2016, 12:11
Цитата: Lodur от июня 11, 2016, 09:25
Цитата: Wolliger Mensch от июня 11, 2016, 07:52Что не так?
Не встречал никогда корня -мотр- с этой приставкой, не могу понять, что он с ней должен означать.

Праслав. *motrъ — r-вое (с закономерной нулевой ступенью корня, вокализованной через *ə) от глагола *mesti «кидать». Само прилагательное не сохранилось, а остался лишь отыменной *motriti в значении др.-русского оборота «мести очима», т. е. «бросать взгляд», «смотреть». Без приставки глагол как в южнославянских, так и в русских говорах, преверб *sъ-, скорее всего, никакой особой семантической нагрузки не нёс, а обозначал лишь полноту действия (аналогичное употребление собирательного наречия широко распространено было, напр., в латинском, прагерманском, равно как и в современных славянских), а с превербом *ъ > въ- — мог иметь как значение интенсификации, так и пространственное значение правления внутрь, ср. русск. смотреть «глядеть» и всматриваться «пристально глядеть на/во что-либо».
Название: Кириллица в Юникоде.
Отправлено: Lodur от июня 11, 2016, 12:24
Цитата: Wolliger Mensch от июня 11, 2016, 12:11Праслав. *motrъ — r-вое (с закономерной нулевой ступенью корня, вокализованной через *ə) от глагола *mesti «кидать». Само прилагательное не сохранилось, а остался лишь отыменной *motriti в значении др.-русского оборота «мести очима», т. е. «бросать взгляд», «смотреть». Без приставки глагол как в южнославянских, так и в русских говорах, преверб *sъ-, скорее всего, никакой особой семантической нагрузки не нёс, а обозначал лишь полноту действия (аналогичное употребление собирательного наречия широко распространено было, напр., в латинском, прагерманском, равно как и в современных славянских), а с превербом *ъ > въ- — мог иметь как значение интенсификации, так и пространственное значение правления внутрь, ср. русск. смотреть «глядеть» и всматриваться «пристально глядеть на/во что-либо».
Спасибо. Я, было, подумал, что там просто описка, должно быть "усмотрение" (с переходом у - в после гласной: "всмотрение"). Хотя, конечно, тогда не хватает ера после с.
Название: Кириллица в Юникоде.
Отправлено: Vertaler от июня 11, 2016, 12:28
Цитата: Wolliger Mensch от июня 11, 2016, 12:11
Праслав. *motrъ — r-вое (с закономерной нулевой ступенью корня, вокализованной через *ə) от глагола *mesti «кидать».
Как эта гипотеза объясняет лтш. matu 'ощущаю'?
Название: Кириллица в Юникоде.
Отправлено: Γρηγόριος от июня 11, 2016, 12:31
Цитата: Wolliger Mensch от июня 11, 2016, 09:09
Цитата: Γρηγόριος от июня 11, 2016, 08:21
Но для меня всё равно сие не понятно. Что же значит, например, нейтральный ер в овом слове « милосꙏть »?

Сокращённая запись, чтобы не писать милос{ь/ъ}т.

Вы имеете ввиду передачу паерка?
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июня 11, 2016, 13:06
Цитата: Γρηγόριος от июня 11, 2016, 12:31
Вы имеете ввиду передачу паерка?

Грубый вопрос, извините: у вас сегодня день несоображения? :fp:
Название: Кириллица в Юникоде.
Отправлено: Γρηγόριος от июня 11, 2016, 13:10
Ну не емлю никак, этот нейтральный ер ставят когда лень писать ер или ерь? Или что? Объясни‐ста.
Название: Кириллица в Юникоде.
Отправлено: Bhudh от июня 11, 2016, 13:23
Не лень, а неразличимы они в тексте.
Название: Кириллица в Юникоде.
Отправлено: Γρηγόριος от июня 11, 2016, 13:28
Цитата: Bhudh от июня 11, 2016, 13:23
Не лень, а неразличимы они в тексте.

То есть когда невозможно увидеть, есть ли там хвостик? Или когда используется только один ер для выражения обоих?
Название: Кириллица в Юникоде.
Отправлено: Bhudh от июня 11, 2016, 13:37
Цитата: Γρηγόριος от июня 11, 2016, 13:28То есть когда невозможно увидеть, есть ли там хвостик?
Да. В слитном письме, когда соединение представляет собой что-то вроде буквы г, не поймёшь, хвостик там али это ерь присоединили так.

Offtop
Я так понимаю, мы видим перед собой продукт современного образования, когда даже писать слитно не умеют, только в планшеты и клавиатуры тыкать...
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июня 11, 2016, 15:37
Цитата: Bhudh от июня 11, 2016, 13:37
Offtop
Я так понимаю, мы видим перед собой продукт современного образования, когда даже писать слитно не умеют, только в планшеты и клавиатуры тыкать...

Скоропись сильно менялась во времени (не говоря о пространстве), поэтому понять по современной, как писали в Средние века, совершенно невозможно.
Название: Кириллица в Юникоде.
Отправлено: . от июня 20, 2016, 20:23
Цитата: Bhudh от июня 11, 2016, 00:23
Вы думаете, в Уникод его руководители просто так, от балды всё суют? Там на каждый символ каждой версии > 1.1 есть proposal (то бишь представление на включение), на некоторые даже не один, и все они на сайте Уникода выложены.
И далеко не всякий proposal удовлетворяется, кстати. А если и, то далеко не сразу. Можно даже статистику набрать по интервалу приёма.
То есть, вы считаете, что они совершенно умышленно не включают в стандарт некоторые буквы, реально использовавшиеся в письменности (например, яналифный ь), всю кровь уже выпили бардаком с CJK, мурыжат годами пропозалы на реальные письменности, но зато радостно и без лишних вопросов понапихали цветочков, стрелочек, звёздочек и прочих, не имеющих к письменности отношения, узоров?
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июня 20, 2016, 22:19
Цитата: Vertaler от июня 11, 2016, 12:28
Цитата: Wolliger Mensch от июня 11, 2016, 12:11
Праслав. *motrъ — r-вое (с закономерной нулевой ступенью корня, вокализованной через *ə) от глагола *mesti «кидать».
Как эта гипотеза объясняет лтш. matu 'ощущаю'?

А почему славянское слово должно объяснять латышское? По-моему, несколько неправильно поставлен вопрос.
Название: Кириллица в Юникоде.
Отправлено: лад от июня 20, 2016, 22:25
Фасмер Слово: смотре́ть,
Ближайшая этимология: смотрю́, диал. мотре́ть, олонецк., казанск., нижегор.; укр. смотрíти, смотрю́, др.-русск. съмотрѣти, ст.-слав. съмотрити καταμαθεῖν, κατανοῆσαι (Супр. и др.), цслав. мотрити, мощрıѫ, болг. мо́тря "смотрю", сербохорв. мо̀трити, мо̀три̑м -- то же, словен. smotrìv, род. п. -ívа "осмотрительный".
Дальнейшая этимология: Праслав. motriti в соединении с приставкой sъ-, производное от *motrъ, родственного лит. matrùs, išmatrùs "осторожный", įmatrùs "ловкий", matýti, mataũ "смотреть", лтш. mast, matu "воспринимать, чувствовать", matît "чувствовать, замечать", греч. ματεύω "ищу, стремлюсь", μάτος ср. р. "разыскание", ματεῖ ̇ ζητεῖ, μάσσαι ̇ ζητῆσαι (Гесихий), ματήρ ̇ ἐπίσκοπος, ματηρεύειν, μαστεύειν ̇ ζητεῖν (Гесихий); см. Мейе, Ét. 409; Траутман, ВSW 171; М.--Э. 2, 566; Розвадовский, Qu. Gr. 2, 260; Фик, KZ 22, 381; Френкель, IF 49, 208 и сл.; Прельвиц, ВВ 26, 308; Бехтель, Lех. 223.
Комментарии Трубачева: [Ср. еще болг. смо́тра "думаю, считаю"; см. Стойков, БЕ, 5, 1955 стр. 11 а также Махек, SPFFBU, 4, 1955, стр. 32. -- Т.]
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июня 20, 2016, 23:10
Лад, а для чего сообщение без слов?
Название: Кириллица в Юникоде.
Отправлено: klangtao от июня 21, 2016, 14:30
Цитата: Bhudh от июня 11, 2016, 00:23
Вы думаете, в Уникод его руководители просто так, от балды всё суют?
В общем, да. Иначе бы буква Ѽ ѽ там не называлась cyrillic capital/small letter omega with titlo, где за титло первоначально приняли "великий апостроф" (сочетание придыхания и каморы в местоимениях о! оле!). Кстати, у всех она изображается именно так  (https://upload.wikimedia.org/wikipedia/commons/thumb/3/3b/%D0%9E%D0%BC%D0%B5%D0%B3%D0%B0_%D1%81_%D0%B2%D0%B5%D0%BB%D0%B8%D0%BA%D0%B8%D0%BC_%D0%B0%D0%BF%D0%BE%D1%81%D1%82%D1%80%D0%BE%D1%84%D0%BE%D0%BC.jpg/50px-%D0%9E%D0%BC%D0%B5%D0%B3%D0%B0_%D1%81_%D0%B2%D0%B5%D0%BB%D0%B8%D0%BA%D0%B8%D0%BC_%D0%B0%D0%BF%D0%BE%D1%81%D1%82%D1%80%D0%BE%D1%84%D0%BE%D0%BC.jpg), или старые версии шрифтов кому-то до сих пор подставляют Ѡ҃, ѡ҃? А буква Ꙋ ꙋ ((http://irmologion.ru/pic/lett24.gif))у всех отображается?
Название: Кириллица в Юникоде.
Отправлено: Rwseg от июня 21, 2016, 14:43
Цитата: Bhudh от июня 11, 2016, 00:23
Вы думаете, в Уникод его руководители просто так, от балды всё суют?
Без сомнения, иначе бы он не представлял из себя бессистемную свалку символов.*
* Систему какую-то там, конечно, пытаются соблюсти, но всё равно получилась свалка.
Название: Кириллица в Юникоде.
Отправлено: Bhudh от июня 21, 2016, 18:49
Цитата: . от июня 20, 2016, 20:23То есть, вы считаете, что они совершенно умышленно не включают в стандарт некоторые буквы, реально использовавшиеся в письменности (например, яналифный ь), всю кровь уже выпили бардаком с CJK, мурыжат годами пропозалы на реальные письменности, но зато радостно и без лишних вопросов понапихали цветочков, стрелочек, звёздочек и прочих, не имеющих к письменности отношения, узоров?
Вините MicroSoft и его шрифты серии Windings. Они всех приучили к украшательствам, а потом пришёл Уникод. И ему сказали — а мы хотим украшательства, как привыкли!


Цитата: Rwseg от июня 21, 2016, 14:43Без сомнения, иначе бы он не представлял из себя бессистемную свалку символов.*
* Систему какую-то там, конечно, пытаются соблюсти, но всё равно получилась свалка.
Свалка получилась от того, что пересортировать блоки нельзя: вся обратная совместимость рухнет.
Сначала решили, что 640 килобайт одной плоскости хватит всем, потом внезапно оказалось, что письменностей на планете куда больше, чем они рассчитывали, и вновь введённые пришлось упыривать в конец.
Название: Кириллица в Юникоде.
Отправлено: klangtao от июня 21, 2016, 20:50
Цитата: klangtao от июня 21, 2016, 14:30
местоимениях
междометиях, конечно
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июня 21, 2016, 22:26
Цитата: Bhudh от июня 21, 2016, 18:49
Свалка получилась от того, что пересортировать блоки нельзя: вся обратная совместимость рухнет.
Сначала решили, что 640 килобайт одной плоскости хватит всем, потом внезапно оказалось, что письменностей на планете куда больше, чем они рассчитывали, и вновь введённые пришлось упыривать в конец.

Бардак по следующим причинам:
1) Смена парадигм: сначала хотели вставить в уникод вообще все возможные знаки, цельные, раздельные — не важно. При это знаки вставлялись по визуальному сходству, а с другой стороны — по скриптам. Потом парадигма изменилась: развился опентайп, и пошли-поехали гнать буквы отдельно, диакритики отдельно, причём по трудно определимой системе — в одних случаях диакритики отделялись, в других нет, опентайпом же заткнули и скриптовые варианты одних и тех же букв. Вкупе с двойственностью основы (внешний вид ~ скрипта) привело к изрядной каше.
2) Советники-шарлатаны. История с ѽ — это ещё что — это мелкие косяки, которых по всей таблице много. Что они там с грузиницей нахимичили... А что они курили, когда соединили русскую гражданскую азбуку и «климентовицу» — вообще неизвестно. До сих пор для слависта нормальной работы нет — несколько шрифтов, уникодовские костыли в виде дополнительных таблиц, совокупления с неопентайпными шрифтами (это, вроде бы, уже уходит в прошлое).
3) Вы говорите о совместимости, что однако не мешает консорциуму периодически «рекомендовать» использовать вместо одних знаков другие. Люди рекомендациям следуют, совместимость сохраняется лишь формально — новые шрифты нередко «нерекомендованных» знаков уже не содержат.
Название: Кириллица в Юникоде.
Отправлено: Γρηγόριος от июня 21, 2016, 22:47
Цитата: Bhudh от июня 21, 2016, 18:49
...
Цитата: Rwseg от июня 21, 2016, 14:43Без сомнения, иначе бы он не представлял из себя бессистемную свалку символов.*
* Систему какую-то там, конечно, пытаются соблюсти, но всё равно получилась свалка.
Свалка получилась от того, что пересортировать блоки нельзя: вся обратная совместимость рухнет.
Сначала решили, что 640 килобайт одной плоскости хватит всем, потом внезапно оказалось, что письменностей на планете куда больше, чем они рассчитывали, и вновь введённые пришлось упыривать в конец.

Рѣшенїе просто, нужно лишь создать нову кодировку; како нѣкогда вси перешли (нѣкїи немногїи не перешли) на Юнїкодъ, тако и нынѣ перейдутъ на более совершенную кодировку.

Название: Кириллица в Юникоде.
Отправлено: Basil от июня 22, 2016, 00:24
Цитата: Γρηγόριος от июня 21, 2016, 22:47
Рѣшенїе просто, нужно лишь создать нову кодировку; како нѣкогда вси перешли (нѣкїи немногїи не перешли) на Юнїкодъ, тако и нынѣ перейдутъ на более совершенную кодировку.
А ресурсы откуда? Добровольцев набрать, как википедию делают? 
Название: Кириллица в Юникоде.
Отправлено: Bhudh от июня 22, 2016, 03:01
Цитата: Γρηγόριος от июня 21, 2016, 22:47како нѣкогда вси перешли (нѣкїи немногїи не перешли) на Юнїкодъ
Цитата: https://w3techs.com/technologies/details/en-utf8/all/allUTF-8 is used by 87.1% of all the websites whose character encoding we know.
13% от числа всех страничек в сети — это не «нѣкїи немногїи», это вполне приличное число. Причём в рунете этот процент ещё выше, я сайты с КОИ-8 встречал.
Название: Кириллица в Юникоде.
Отправлено: amdf от июня 22, 2016, 10:51
А ещё у Юникода есть замечательный принцип: однажды названный символ НИКОГДА не меняет своего названия. Даже если был назван с явной, бросающейся в глаза, ошибкой.

Примеры из http://unicode.org/notes/tn27/ (http://unicode.org/notes/tn27/)

U+01A3 LATIN SMALL LETTER OI

These should have been called letter GHA. They are neither pronounced 'oi' nor based on the letters 'o' and 'i'.

U+0CDE KANNADA LETTER FA

There is no Kannada letter 'fa', this character represents the syllable 'llla'
Название: Кириллица в Юникоде.
Отправлено: Bhudh от июня 22, 2016, 13:25
Цитата: amdf от июня 22, 2016, 10:51однажды названный символ НИКОГДА не меняет своего названия
Неправда. Названия из Unicode 1.0 были изменены. Количества не знаю, но специальная графа в BabelMap говорит сама за себя:
(http://i.prntscr.com/6665fcce058547898c2366a648ad64f2.png)

А для неправильно названных глифов существуют примечания типа
Цитата: Formal aliases: KANNADA LETTER LLLA
Notes: obsolete historic letter
          name is a mistake for LLLA
Название: Кириллица в Юникоде.
Отправлено: amdf от июня 22, 2016, 14:38
Цитата: Bhudh от июня 22, 2016, 13:25
Цитата: amdf от июня 22, 2016, 10:51однажды названный символ НИКОГДА не меняет своего названия
Неправда. Названия из Unicode 1.0 были изменены.

Правда. В Unicode 2.0+ символы больше не могут менять названия, никогда. http://www.unicode.org/policies/stability_policy.html
Название: Кириллица в Юникоде.
Отправлено: Bhudh от июня 22, 2016, 14:48


То есть символ, названный в Unicode 1.0 — это не
Цитата: amdf от июня 22, 2016, 10:51однажды названный символ


?
:eat:
Название: Кириллица в Юникоде.
Отправлено: amdf от июня 22, 2016, 15:19
Да мне пофиг.
Название: Кириллица в Юникоде.
Отправлено: . от июня 26, 2016, 03:02
Цитата: Bhudh от июня 22, 2016, 14:48


То есть символ, названный в Unicode 1.0 — это не
Цитата: amdf от июня 22, 2016, 10:51однажды названный символ


?
:eat:
Начиная с версии 2.0 — никогда. Там они ещё и некоторые блоки местами поменяли.

Название: Кириллица в Юникоде.
Отправлено: . от июня 26, 2016, 03:06
Цитата: Bhudh от июня 22, 2016, 03:01
Цитата: Γρηγόριος от июня 21, 2016, 22:47како нѣкогда вси перешли (нѣкїи немногїи не перешли) на Юнїкодъ
Цитата: https://w3techs.com/technologies/details/en-utf8/all/allUTF-8 is used by 87.1% of all the websites whose character encoding we know.
13% от числа всех страничек в сети — это не «нѣкїи немногїи», это вполне приличное число. Причём в рунете этот процент ещё выше, я сайты с КОИ-8 встречал.
Это всё равно маргиналы. Часть из них перейдут на Юникод когда-нибудь. Например, когда узнают, что такое SEO, и как негативно на их позициях сказывается приверженность архаичным кодировкам. ;D
Название: Кириллица в Юникоде.
Отправлено: Hellerick от июня 26, 2016, 07:09
Windows на Unicode перейдет когда-нибудь?
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июня 26, 2016, 08:24
Цитата: Hellerick от июня 26, 2016, 07:09
Windows на Unicode перейдет когда-нибудь?

Вы о чём?
Название: Кириллица в Юникоде.
Отправлено: Hellerick от июня 26, 2016, 08:37
Об отказе от ANSI и DOS'овсих кодировок, которые до сих пор часто всплывают как кодировки по умолчанию.

У меня вот нет Windows 10. Когда там текстовой файл из блокнота сохраняешь, какая кодировка получается? Или когда документ из Word'а сохраняешь как html?
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июня 26, 2016, 08:59
Цитата: Hellerick от июня 26, 2016, 08:37
У меня вот нет Windows 10. Когда там текстовой файл из блокнота сохраняешь, какая кодировка получается? Или когда документ из Word'а сохраняешь как html?

И что мешает при сохранении UTF-8 выбрать?
Название: Кириллица в Юникоде.
Отправлено: Hellerick от июня 26, 2016, 11:15
То, что другие так не делают.
Качаешь файлы с интернетов, пытаешься архивы открывать, а там — забугорные кодировки, которые еще надо ухитриться расшифровать.
Пока Windows от подобной политики не откажется, победы UTF-8 ждать не приходится.
Название: Кириллица в Юникоде.
Отправлено: Bhudh от июня 26, 2016, 11:19
Вот результаты за сутки, например: (Google) win-1252 (https://www.google.ru/search?q=win-1252&num=50&newwindow=1&client=opera&hs=IZ7&channel=suggest&tbs=qdr%3Ad&oq=win-1252&gs_l=heirloom-serp.3..0i7i30j0j0i7i30l5j0i30l3.43168.43348.0.43707.2.2.0.0.0.0.189.189.0j1.1.0....0...1ac.1.34.heirloom-serp..1.1.189.AKL1-GCtOqY)

Вот вопрос на Stack Overflow 2 часа назад: http://stackoverflow.com/questions/38035667/how-to-make-this-code-most-interactive. В примере HTML-кода: charset=windows-1252.
Название: Кириллица в Юникоде.
Отправлено: Rwseg от июля 13, 2016, 23:50
Цитата: Bhudh от июня 21, 2016, 18:49
Цитата: Rwseg от июня 21, 2016, 14:43Без сомнения, иначе бы он не представлял из себя бессистемную свалку символов.*
* Систему какую-то там, конечно, пытаются соблюсти, но всё равно получилась свалка.
Свалка получилась от того, что пересортировать блоки нельзя: вся обратная совместимость рухнет.
Сначала решили, что 640 килобайт одной плоскости хватит всем, потом внезапно оказалось, что письменностей на планете куда больше, чем они рассчитывали, и вновь введённые пришлось упыривать в конец.
Давайте для примера возьмём латиницу, киррилицу и арабицу.
С одной стороны постулируется приверженность к комбайнам, с другой стороны напихано куча прекомпозитов.

Я могу понять стремление впихнуть прекомпозиты из старых кодировок (ISO, Win), но когда все возможные старые кодировки были отражены, зачем пихать ещё и ещё прекомпозиты?

Первая часть кириллического блока вполне отражала Win-1251+ISO, но дальше пошло-поехало свалка. Кроме реально неразделимых букв (типа ҕ ҥ), начали пихать прекомпозиты, но зачем, какую старую кодировку они отражали? При этом прекомпозитов для знака ударения нет, полагайтесь на диакритики и хороший шрифт. При этом внезапно запихнули ѐ и ѝ. Извините, а чем они отличаются от е́ и и́, что первые достойны отдельного места? Какой-нибудь ӭ есть отдельно, вот для э̄ (макрон очень распространён в языках Крайнего Севера) пожалуйте использовать комбайн.

В арабском ещё хуже. Вместо нормального блока базовых форм без точек и отдельного блока для диакритик (точек и подобного), напихнули какие только можно и не можно прекомпозитов, из самых редких языков, там свалка невообразимая без какой-либо системы.
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июля 14, 2016, 00:19
Цитата: Rwseg от июля 13, 2016, 23:50
Я могу понять стремление впихнуть прекомпозиты из старых кодировок (ISO, Win), но когда все возможные старые кодировки были отражены, зачем пихать ещё и ещё прекомпозиты?

Первая часть кириллического блока вполне отражала Win-1251+ISO, но дальше пошло-поехало свалка. Кроме реально неразделимых букв (типа ҕ ҥ), начали пихать прекомпозиты, но зачем, какую старую кодировку они отражали? При этом прекомпозитов для знака ударения нет, полагайтесь на диакритики и хороший шрифт. При этом внезапно запихнули ѐ и ѝ. Извините, а чем они отличаются от е́ и и́, что первые достойны отдельного места? Какой-нибудь ӭ есть отдельно, вот для э̄ (макрон очень распространён в языках Крайнего Севера) пожалуйте использовать комбайн.

В арабском ещё хуже. Вместо нормального блока базовых форм без точек и отдельного блока для диакритик (точек и подобного), напихнули какие только можно и не можно прекомпозитов, из самых редких языков, там свалка невообразимая без какой-либо системы.

Э! Не сметь поднимать руку на прекомпозиты! (http://www.kolobok.us/smiles/personal/big_boss.gif)
Название: Кириллица в Юникоде.
Отправлено: Basil от июля 14, 2016, 03:49
Цитата: Wolliger Mensch от июля 14, 2016, 00:19
Цитата: Rwseg от июля 13, 2016, 23:50
Я могу понять стремление впихнуть прекомпозиты из старых кодировок (ISO, Win), но когда все возможные старые кодировки были отражены, зачем пихать ещё и ещё прекомпозиты?

Первая часть кириллического блока вполне отражала Win-1251+ISO, но дальше пошло-поехало свалка. Кроме реально неразделимых букв (типа ҕ ҥ), начали пихать прекомпозиты, но зачем, какую старую кодировку они отражали? При этом прекомпозитов для знака ударения нет, полагайтесь на диакритики и хороший шрифт. При этом внезапно запихнули ѐ и ѝ. Извините, а чем они отличаются от е́ и и́, что первые достойны отдельного места? Какой-нибудь ӭ есть отдельно, вот для э̄ (макрон очень распространён в языках Крайнего Севера) пожалуйте использовать комбайн.

В арабском ещё хуже. Вместо нормального блока базовых форм без точек и отдельного блока для диакритик (точек и подобного), напихнули какие только можно и не можно прекомпозитов, из самых редких языков, там свалка невообразимая без какой-либо системы.

Э! Не сметь поднимать руку на прекомпозиты! (http://www.kolobok.us/smiles/personal/big_boss.gif)
Аргументы? Почему ѐ и ѝ - прекомпозиты, а е́ и и́ - нет?  :-[
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июля 14, 2016, 09:14
Цитата: Basil от июля 14, 2016, 03:49
Аргументы? Почему ѐ и ѝ - прекомпозиты, а е́ и и́ - нет?  :-[

Потому что не доделали. Во-первых, переход на поскриптную основу в уникоде проходит очень тяжело и непоследовательно. А в каждой скрипте есть набор составных знаков, которые рациональнее задать прекомпозитами. К таким в русской гражданке относятся буквы гласных со знаком ударения. Но не сделали до сих пор. А учитывая лобби идиотов, которые настаивают на отказ от прекомпозитов, сделают, видимо, ещё не скоро.

Впрочем, если текстологи и проч. лингвисты и филологы написали бы письмо по этому поводу в консорциум, как это уже бывало в прошлом. Но сколько пишущих на русском лингвистов и филологов дружат с шрифтовым делом и знаниями о письменностях вообще, и которых не устраивает «и так сойдёт»?
Название: Кириллица в Юникоде.
Отправлено: Hellerick от июля 14, 2016, 09:38
Хеллерику прекомпозитов всё равно не хватит, так что пусть лучше модификаторы до ума доводят.
Название: Кириллица в Юникоде.
Отправлено: Basil от июля 14, 2016, 23:19
Цитата: Wolliger Mensch от июля 14, 2016, 09:14
Цитата: Basil от июля 14, 2016, 03:49
Аргументы? Почему ѐ и ѝ - прекомпозиты, а е́ и и́ - нет?  :-[
А в каждой скрипте есть набор составных знаков, которые рациональнее задать прекомпозитами. К таким в русской гражданке относятся буквы гласных со знаком ударения.
Не вижу, чем это "рациональнее".  :???
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июля 14, 2016, 23:29
Цитата: Basil от июля 14, 2016, 23:19
Не вижу, чем это "рациональнее".  :???

Тем, что они стандартные для учебной и научной литературы, а также в обычной — для обозначения слов, различающих только ударением (больша́я ~ бо́льшая, узна́ю ~ узнаю́...). Большинство шрифтов содержат русскую таблицу уникода только в ограниченном национальным алфавитом виде и не содержат таблицы комбайнов, а также не совместимы с технологией Опентайп (не говоря о том, что далеко не все программы с ней совместимы). В результате ударение обозначается как попало, чаще всего заглавной буквой. Как итог — даже в специальной литературе ударение нередко обозначается суррогатными способами, что выглядит дикостью и порухой всякой типографической культуры.
Название: Кириллица в Юникоде.
Отправлено: Hellerick от июля 15, 2016, 04:13
Если в издательстве не могут поставить ударения, то это очень фиговое издательство. И лечить нужно такие издательства, а не Unicode.
Бумажные книжки они ведь тем и замечательны: один раз всё правильно настроил, и они потом всю жизнь правильно отображать текст будут.
Я вот почему-то свои книжки в польской кириллице и т. п. с любыми дикими символами печатаю.

А вообще, я размечтался об онлайн-wiki-шрифте, в который каждый сможет добавлять любые нужные символы и данные кернинге, композитах и т. п.
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июля 15, 2016, 10:33
Цитата: Hellerick от июля 15, 2016, 04:13
Если в издательстве не могут поставить ударения, то это очень фиговое издательство. И лечить нужно такие издательства, а не Unicode.

Логика, равносильная такой: «Человек не может каменным топором сделать микропроцессор? — Нужно менять человека, а не топор». :fp:

Фиговость издательства никак не отменяет и не преуменьшает фиговость уникода.
Название: Кириллица в Юникоде.
Отправлено: Demetrius от июля 15, 2016, 10:35
Цитата: Hellerick от июля 15, 2016, 04:13
А вообще, я размечтался об онлайн-wiki-шрифте, в который каждый сможет добавлять любые нужные символы и данные кернинге, композитах и т. п.
Для шрифтов ВэньЦюаньИ есть какой-то онлайн-редактор (см. на главной (http://wenq.org/wqy2/index.cgi?action=browse&id=Home&lang=en) ссылки на иероглифы под «Click to draw»). Я, правда, не разбирался, как он работает. И он на китайском.

Кернинга и композитов там нет, но для китайского это не актуально. А так — в принципе, шаг как раз в ту сторону.

Кстати, яваскриптовые редакторы шрифтов есть, как минимум http://glyphrstudio.com/ — им я, опять же, тоже не пользовался, но arseniiv вроде бы пробовал.
Название: Кириллица в Юникоде.
Отправлено: Basil от июля 15, 2016, 22:26
Цитата: Wolliger Mensch от июля 15, 2016, 10:33
Цитата: Hellerick от июля 15, 2016, 04:13
Если в издательстве не могут поставить ударения, то это очень фиговое издательство. И лечить нужно такие издательства, а не Unicode.
Логика, равносильная такой: «Человек не может каменным топором сделать микропроцессор? — Нужно менять человека, а не топор». :fp:
Логично, либо человек (издательство) вместо топора возьмет нужный инструмент (поставит шрифты и программы, нормально поддерживающие Юникод), либо надо поменять на другого человека.
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июля 15, 2016, 23:34
Цитата: Basil от июля 15, 2016, 22:26
Логично, либо человек (издательство) вместо топора возьмет нужный инструмент (поставит шрифты и программы, нормально поддерживающие Юникод), либо надо поменять на другого человека.

Вот и я о том же. Только вы предлагаете вместо одного большого каменного топора взять десять маленьких медных, а не разработать современный инструмент и работать им.
Название: Кириллица в Юникоде.
Отправлено: Hellerick от июля 16, 2016, 06:39
Но ведь это вы предлагаете наделать множество случайных прекомпозитов, вместо того, чтобы иметь один универальный инструмент.
Название: Кириллица в Юникоде.
Отправлено: Wolliger Mensch от июля 16, 2016, 08:17
Цитата: Hellerick от июля 16, 2016, 06:39
... случайных прекомпозитов, вместо того,

Процитируйте, где я такое говорил.

Цитата: Hellerick от июля 16, 2016, 06:39
... чтобы иметь один универальный инструмент.

Просто показывает, что вы мало этим занимались, и не понимаете, что универсальность там заканчивается сразу, как только дело доходит для представления реальных текстов.
Название: Кириллица в Юникоде.
Отправлено: . от июля 17, 2016, 09:24
Цитата: Rwseg от июля 13, 2016, 23:50
Давайте для примера возьмём латиницу, киррилицу и арабицу.
С одной стороны постулируется приверженность к комбайнам, с другой стороны напихано куча прекомпозитов.
«Концепция изменилась».
Название: Кириллица в Юникоде.
Отправлено: Валентин Н от апреля 1, 2017, 21:32
Цитата: Γρηγόριος от июня 10, 2016, 22:55
А начну я с буквы под названием « Cyrillic Letter Neutral Yer »: . Кто знает зачем нужна сия буква? Может для одноеровых рукописей?
Кириллик экстендед С, это что за ужас такой? Что за диковинные символы там содержатся, не буквы, а каляки какие-то.
Название: Кириллица в Юникоде.
Отправлено: Γρηγόριος от апреля 1, 2017, 21:43
Вовсе не диковинные, а без которых невозможно передать многие памятники словенского языка. Загляните сюда (http://lingvoforum.net/index.php/topic,87137.0.html).