Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Юникод отстой

Автор Nevik Xukxo, октября 17, 2011, 15:39

0 Пользователи и 1 гость просматривают эту тему.

Искандер

Цитата: Тайльнемер от октября 19, 2011, 18:34
Особенно непонятно в неславянских кириллицах.
абхазам главное чтобы все апострофы на месте были.
хотя стой.
2011>1993?
тогда абхазам вовсе плевать.

У кого у нас на славянской основе прям много так диакритики-то?
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Тайльнемер

Цитата: Hellerick от октября 19, 2011, 18:39
А в славянских проще? Ё, Й, Ї? Русам-украм будет трудно объяснить, почему этим буквам не выделили отдельный код.
Здесь хотя бы визуально явно диакритика. И не страшно, что И и Й будут записываться разным числом байт.
Я про ҙҫ қҭңҳҷӷҋщц ӆӊӎ ӌ ӈӄԓ ҧԡԣ ӽӻ ԉԋԏ и т. п. — что из этого считать отдельными буквами, а что буквами с диакритическими знаками?

Искандер

Цитата: Тайльнемер от октября 19, 2011, 18:58
ҙҫ
имхо, и то с натяжкой.
Остальные - модификаты, которые при том, в отличие от датского ö имеют более одного параметра совместимости.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Hellerick

С точки зрения дизайнеров шрифтов, критерием диакритики является возможность на стандартный глиф буквы накладывать глиф диакритического знака (желательно, также стандартного) — без каких-либо дополнительных модификаций формы глифа.

Искандер

Цитата: Hellerick от октября 19, 2011, 19:31
С точки зрения дизайнеров шрифтов, критерием диакритики является возможность на стандартный глиф буквы накладывать глиф диакритического знака (желательно, также стандартного) — без каких-либо дополнительных модификаций формы глифа.
Именно поэтому я и сказал, что
Цитата: Тайльнемер от октября 19, 2011, 18:58
ԉԋԏ
ӈӄԓ
и даже невинные
Цитата: Тайльнемер от октября 19, 2011, 18:58
ҧԡԣ ӽӻ
қҭңҳҷ
и несуществующее в природе
Цитата: Тайльнемер от октября 19, 2011, 18:58
ӷ

по накатанной схеме не покатят.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Тайльнемер

Ясно.
А из этого что сойдёт за диакритику, а что нет:
ĄąĘęĮįǪǫŲų ƠơƯư Ç窺ŢţȨȩ ĶķĻļŖŗ ȘșȚț ȿ ĽľĿŀⱢɫ ɚɝ
?

Искандер

Цитата: Тайльнемер от октября 19, 2011, 20:12
Ơơ
сомнения, я слабо представляю, как оно там рисуется.

Цитата: Тайльнемер от октября 19, 2011, 20:12
ȿ
на практике реализуют, выглядит не топорно, но нужно учитывать особенности шрифта, чтобы углы засечек у S и Z не дестроили.

Цитата: Тайльнемер от октября 19, 2011, 20:12
ɚɝ
Вообще никак не пойдут. нужны отдельные глифы для суммы буквы и диакритики.

Вообще везде, где диакритика касается отпечатка буквы, точнее, где она не просто касается, а объединяется в штрихах — нужны отдельные глифы, потому что хороший шрифт подгоняет места сочленений под условия неблевабельности.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Hellerick

Цитата: Искандер от октября 19, 2011, 20:20
Цитата: Тайльнемер от октября 19, 2011, 20:12
Ơơ
сомнения, я слабо представляю, как оно там рисуется.

Насколько я понимаю, все буквы, у которых диакритика «хватается» за уголок, потенциально не входят в состав «чистых диакритических», т.к. диакритика может повлиять на засечки из этого уголка произрастающие. Это касается и буквы Ưư. А раз у нее хвостик не есть чистая диакритика, то и у Ơơ лучше иметь для нее такой же статус.

Тайльнемер

А как у Юникода обстоят дела с арабским? Отдельный диапазон юникода для контекстно-меняющихся букв и отдельный для позиционных форм — это хорошо или плохо?

Искандер

главное што результат похож на текст горизонтальным насхом.
ряд вкерьикальных лигатур итоже есть, лям. ха там, лям мим...
то есть главное -- удобство. поиск же рабатай. вроде всио.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Тайльнемер

Цитата: Искандер от октября 20, 2011, 05:50
главное што результат похож на текст горизонтальным насхом.
ряд вкерьикальных лигатур итоже есть, лям. ха там, лям мим...
то есть главное -- удобство. поиск же рабатай. вроде всио.
я ньпонемаю што вы пиеште -- можо порусски.
Вы в том смысле, что с арабским в Юникоде всё хорошо?
А для греческой сигмы по той же логике не надо выделить 3 символа: контекстнозависимую и две позиционные формы?

Искандер

три сигмы? третья то укая?
арабский и гречечкий вроде бы норм работаъът.. только в греческом диакритики отдедьные ли?
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Python

Цитироватьтри сигмы?
Две те, что есть в юникоде (σ и ς), и одна со спосбностью автоматически подстраивать свой внешний вид под позицию в слове (предлагалась, но бьіла отклонена). Для арабской письменности обычно только такие «автоматические» буквы и используются.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Искандер

а сигма разве всегда пережд ппробелом раскрывается?
Софиты вон нет. и в юнике софиты отдельно кодируютчя всегжда.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Demetrius

Цитата: Тайльнемер от октября 20, 2011, 02:51
А как у Юникода обстоят дела с арабским? Отдельный диапазон юникода для контекстно-меняющихся букв и отдельный для позиционных форм — это хорошо или плохо?
Вот насчет этого не уверен. Понятно, что это добавили для совместимости.

Думаю, что это плохо. Например, консоль Linux не поддерживает нормальный арабский. Поэтому vim автоматически заменяет нормальный арабский на неизменяемый, реализуя как бы свою поддержку.

Результат: после копирования текста из вима (мышью; +"y, скорее всего, работает правильно) этот текст портиться.

IMHO должен быть один вариант.

Но я арабского не знаю, так что правьте меня.

Тайльнемер

Цитата: Demetrius от октября 20, 2011, 11:09
IMHO должен быть один вариант.
Один вариант — это статический (каждая форма — отдельный смвол)?

Drundia

Цитата: Demetrius от октября 18, 2011, 20:41
Ну и еще совместимостью: если á был одним символом в cp1250, то он должен остаться одним символом в уникоде.
Бред же! Зачем такое надо, пусть будет двумя в юникоде. Срочно выпилить все эти прекомбайнды!

Drundia

Цитата: Искандер от октября 19, 2011, 14:57
Так вот неполная реализация возможностей шрифтов радует нас во всех вообще програмных продуктах этих наших имбицилов. И это печально, да.
Но.
Смысл последнего предложения от меня старательно ускользает.
Не было бы прекомбайнов — уже б давно довели до ума реализацию возможностей шрифтов.

Тайльнемер

Цитата: Drundia от октября 20, 2011, 14:12
Цитата: Demetrius от октября 18, 2011, 20:41
Ну и еще совместимостью: если á был одним символом в cp1250, то он должен остаться одним символом в уникоде.
Бред же! Зачем такое надо, пусть будет двумя в юникоде. Срочно выпилить все эти прекомбайнды!
:+1:

Hellerick

Тайльнемер, вы бы со своей подписью хотя бы постеснялись здесь появляться.

Demetrius

Цитата: Drundia от октября 20, 2011, 14:12
Цитата: Demetrius от октября 18, 2011, 20:41
Ну и еще совместимостью: если á был одним символом в cp1250, то он должен остаться одним символом в уникоде.
Бред же!
Это еще не самый бред. Самый бред вот:
女 U+5973 CJK UNIFIED IDEOGRAPH-5973 'woman, girl; feminine; rad. 38'
女 U+F981 CJK COMPATIBILITY IDEOGRAPH-F981 'woman, girl; feminine; rad. 38'
⼥ U+2F25 KANGXI RADICAL WOMAN

Ну или вот:
﨑 U+FA11 CJK COMPATIBILITY IDEOGRAPH-FA11 • a unified CJK ideograph, not a compatibility ideograph, despite its name

Demetrius

Цитата: Тайльнемер от октября 20, 2011, 11:52
Цитата: Demetrius от октября 20, 2011, 11:09
IMHO должен быть один вариант.
Один вариант — это статический (каждая форма — отдельный смвол)?
Пофиг какой. Вообще-то все почему-то используют динамические, так что, наверное, оставлять надо их.

Но главное—чтобы один.

Hellerick

Объясните нубу, что это за компабилити такие, и чем они от юнайтедов отличаются?

Demetrius

Цитата: Hellerick от октября 20, 2011, 15:49
Объясните нубу, что это за компабилити такие, и чем они от юнайтедов отличаются?
Насколько я понял, «объединенные»—это труъ, которые надо использовать.

Подозреваю, что некоторых кодировках почему-то один иероглиф был записан дважды. Наверное, были причины. Так как преобразование в уникод должно быть инъективным, в уникоде их тоже разделили.

Видимо, последний маразм появился, когда сначала иероглифы посчитали вариантами одного, а потом посчитали разными символами (как островное g и МФА ж).

Drundia

Цитата: Искандер от октября 19, 2011, 17:07
диакритика вечно ползёт. Я не виноват. Даже в ЛаТеКсе, ползёт.
Потому что руки кривые, вот она и ползёт.

Цитата: Hellerick от октября 19, 2011, 18:39
А в славянских проще? Ё, Й, Ї? Русам-украм будет трудно объяснить, почему этим буквам не выделили отдельный код.
Эти хоть носят гордое название буквы и размещены в алфавитах.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр