Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Юникод отстой

Автор Nevik Xukxo, октября 17, 2011, 15:39

0 Пользователи и 1 гость просматривают эту тему.

Nevik Xukxo


Искандер

"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

DarkMax2

Tej wojny nikt za nas nie wygra! © Wiedźmin III
Коли зчинять лемент: "Хто ж знав?!" — відповімо: "Ми".

З моїх снів ти утечеш над ранок,
Терпка, як аґрус, солодка, як біз.
Хочу снить чорні локи сплута́ні,
Фіалкові очі, мокрі від сліз.

Demetrius


Demetrius

Цитата: DarkMax2 от октября 17, 2011, 15:44
альтернатива?
Как в colorForth'е, каждый раз делать свою кодировку для нужной задачи.

DarkMax2

Цитата: Demetrius от октября 17, 2011, 15:48
Цитата: DarkMax2 от октября 17, 2011, 15:44
альтернатива?
Как в colorForth'е, каждый раз делать свою кодировку для нужной задачи.
Феоадализьм. Каждый сидит в своем замке несовместимости :)
Tej wojny nikt za nas nie wygra! © Wiedźmin III
Коли зчинять лемент: "Хто ж знав?!" — відповімо: "Ми".

З моїх снів ти утечеш над ранок,
Терпка, як аґрус, солодка, як біз.
Хочу снить чорні локи сплута́ні,
Фіалкові очі, мокрі від сліз.

Искандер

Существует юникод, его и надо допиливать до совершенства.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Demetrius

Цитата: Искандер от октября 17, 2011, 15:55
Существует юникод, его и надо допиливать до совершенства.
По-моему, там больше выпиливать и перепиливать надо для совершенства.

Цитата: DarkMax2 от октября 17, 2011, 15:51
Феоадализьм. Каждый сидит в своем замке несовместимости :)
Не-а, это современные системы предполагают гигантские замки. КолорФорт больше на палатку похож, чем на замок.

DarkMax2

Tej wojny nikt za nas nie wygra! © Wiedźmin III
Коли зчинять лемент: "Хто ж знав?!" — відповімо: "Ми".

З моїх снів ти утечеш над ранок,
Терпка, як аґрус, солодка, як біз.
Хочу снить чорні локи сплута́ні,
Фіалкові очі, мокрі від сліз.

Demetrius

Цитата: DarkMax2 от октября 17, 2011, 16:07
бомжи в картонных ящиках :)
Картонные ящики создаются для других целей, а тут специально спроектированный с нуля солюшен. Не путайте.

Искандер

Хотелось бы увидеть реальные дела, а не трёп на тр.форуме лф.форуме
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

DarkMax2

Я, кстати, как-то делал шрифт для анбура, но всё пропало (с) вместе с диском.
Tej wojny nikt za nas nie wygra! © Wiedźmin III
Коли зчинять лемент: "Хто ж знав?!" — відповімо: "Ми".

З моїх снів ти утечеш над ранок,
Терпка, як аґрус, солодка, як біз.
Хочу снить чорні локи сплута́ні,
Фіалкові очі, мокрі від сліз.

Demetrius

Цитата: Искандер от октября 17, 2011, 16:13
Хотелось бы увидеть реальные дела, а не трёп на тр.форуме лф.форуме
Вы таки думаете, что кто-то здесь нарисует шрифт? По-моему таким только WM занимался. Куча работы же.

Искандер

"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Искандер

Цитата: Demetrius от октября 17, 2011, 16:58
Вы таки думаете, что кто-то здесь нарисует шрифт? По-моему таким только WM занимался. Куча работы же.
Ну тк тады чо трепаться-то?
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Demetrius

Цитата: Искандер от октября 17, 2011, 18:08
Цитата: Demetrius от октября 17, 2011, 16:58
Вы таки думаете, что кто-то здесь нарисует шрифт? По-моему таким только WM занимался. Куча работы же.
Ну тк тады чо трепаться-то?
А зачем тады форум?

Yitzik

В документах с экзотической орфографией или с сочетанием нескольких разпоисьменных языков Юникод - единственно реальное решение.
Paran Quenya ar quetin Esperanto!

Искандер

А мужики-то не знали...
Лучше пущь Деметриус расскажет що ему так в юнике не любо.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Demetrius

Цитата: Искандер от октября 18, 2011, 05:35
Лучше пущь Деметриус расскажет що ему так в юнике не любо.
Громоздкость. Любая реализация уникода проклята быть громоздкой. Более того, полной реализации юникода нет и вряд ли она когда-то будет.

Конкретно по пунктам.

Непоследовательность. Половина диакритиков прямо в буквах, половина—отдельно. Для совместимости. В итоге любая реализация юникода обязана тащить это за собой.

(Кроме того, наличие прекомбинированных букв часто избавляет разработчиков от нужды создавать комбинируемую диакритику. Т.е. способствует нереализации уникода полностью.)

Нелогичность. Никакой логики в том, что i+акут=í нет, тут нужен банальный список известных сочетаний. IMHO i должна комбинироваться из турецкой ы. Ну, или ладно, i можно оставить, но хотя бы í должна комбинироваться из турецкой ы.

Неопределенность относительно своей цели. В новом уникоде есть невидимые «буквы»-теги для указания языков (т.е. теоретически можно написать невидимую букву r и невидимую букву u, чтобы закодировать элосыюй), хотя понятно, что это не должна быть задача уникода. В итоге никто эти теги не реализовывает: я не видел ни единого приложения!..

Дальше. У меня есть подозрение, что индийские письменности создавали с учетом транслитерации. Чтобы написать деванагарский слог «ки», на бумаге сначала надо написать и, а затем к—зато в уникоде с точностью да наоборот. В итоге реализация индийских шрифтов очень сильно затрудняется, а профит (соответствие транслитерации) сомнителен.

Аналогично манчжурский/классический монгольский. Там налицо транслитерация головного мозга. Итог: шрифтов почти нет (Манчуфонт и Монголиан Баити, который в Висте с багами, не позволяющими его использовать).

В ханьскознаках вообще нет логики. Как определяется, какие иероглифы объединять в варианты, а какие нет—загадка. В слове sam6mo1/shen4me0 'что' первый иероглиф можно записать двумя вариантами, а 'кость' не разделили на две.

Demetrius

Короче, полная реализация уникода невозможна в принципе.

Это выгодно. Пусть люди покупают новые операционные системы и редакторы. А в них кроме улучшений уникода еще и много чего напихают, так что пусть они еще и новые компьютеры покупают.

Самое лучшее, что можно сделать в этой ситуации—вынести реализацию отдельных кусков уникода за пределы ОС, чтобы их было легко доустанавливать. Так сделали в SIL Graphite, перенеся часть функций из программы отрисовки в шрифт. Но результат—увеличение сложности шрифтов, которые и без того сложно создавать.


Короче, иногда мне кажется, что хранить каждый текст в своей кодировке (CP1251 для русского, Big5 и CN-GB для китайского)—это правильно; да и места меньше занимает. Но лень.

Demetrius


Искандер

Мыщь по джеву нам и самим свойственна, такшта мы не против.
Остальное как-то претензионно. То есть в отношение этих ваших монгольских закорючек и китайских казюлек я не спец и ничего особо умного слёту не скажу, но про деванагари и i/ı и  ìíîïīĭį вы не правы. С разными "и" в юникоде конешно испраштили костылик, но он имеет историческую подоплёку и интуитивно понятен. Единственный момент для меня пока спорный это кириллическое і а точнее І, коее у хохлов то с точкой печаталось, то без яе.
Единость кодировки есть суровой необходимостью. Пользователям нужна система, позволяющая всем и всегда видеть именно то, что и все остальные, без долгих мучительных перенапряжений круговой мышцы. Вообще стоит соорудить, знаете?, список критериев -- какая она -- единая всеобщая глобальная идеальная кодировка.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Demetrius

Цитата: Искандер от октября 18, 2011, 08:37но про деванагари
Вроде бы в какой-то из тамошних письменностей (тамильской, что ли?) буквы в уникоде расположены в обратном порядке: сначала гласная, потом согласная. Для совместимости с существующей кодировкой. И ничего.

Цитироватьи i/ı и  ìíîïīĭį вы не правы. С разными "и" в юникоде конешно испраштили костылик, но он имеет историческую подоплёку и интуитивно понятен.
Меня бесит непоследовательность. Либо кодируем визуально (тогда турецкая ы+диакритика, как в TeX'е \i), либо логически (тогда зачем отделяли румынские s с запятой от турецких?). А так используется то один, то второй подход.


ЦитироватьЕдинственный момент для меня пока спорный это кириллическое і а точнее І, коее у хохлов то с точкой печаталось, то без яе.
Лень стирать цитату на телефоне.

Цитировать
Единость кодировки есть суровой необходимостью. Пользователям нужна система, позволяющая всем и всегда видеть именно то, что и все остальные, без долгих мучительных перенапряжений круговой мышцы.
В том-то и проблема, что из-за монстрообразности уникода у каждого пользователя реализовано только его подмножество. Причем у разных пользователей подмножества разные, и единства нет.

ЦитироватьВообще стоит соорудить, знаете?, список критериев -- какая она -- единая всеобщая глобальная идеальная кодировка.
Что-то мне кажется, что такой не бывает...

Ну, я бы для начала обязал создателей кодировок делать reference implementation. Не «мы примем, а потом кто-то нарисует, может быть», а чтобы сразу был готовый рендерер. Любой. Текст->PDF или текст->ч/б bitmap, не важно. Но чтобы была программа, на которую все равняются (и которую любой может захапать в свой проект).

Это бы уберегло кодировку от части проблем.

Искандер

Деметрие, какой высоты был дуб (простите, шо без цытаты, речь про ş и вторую) это РАЗНЫЕ БУКВЫ -- у одной комбелов (румынская), у второй подписная эс (турецкая). Они выглядять по-разному.
"Niech żyją POLACY!! Ponieważ polacy są rasej nadczłowieków. Od nich jest przyszłość planety. Oni przeżyją nawet wojną atomowę, dlatego, że polacy są wieczni, bo chtoniczni. I dadzą potomstwo, które też będzie polakami i polkami. Niech żyjemy, hura!.." (c) Awwal12

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр