Цитата: sknente от февраля 10, 2008, 02:24Юникод уже давно 32 битный. Про несуществующий 8 - битный Юникод понял мало. Имею только предположить, что имелся в виду UTF-8. А про ARM вовсе ничего не понял. Это - Abstract Rewriting Machine?
Проблема не в юникоде, проблема в программах которые его не поддерживают. Если б все на свете везде кодировалось только в юникоде, то 'ı' всегда было бы 'ı'. А если человек пишет на машине с турецкой кодировкой, а у вас стоит win-1251, то создание отдельной таблицы для турецкого и македонского это никак не исправит. Все равно кодировки будут разные, а значит будут использоваться разные глифы для верхних символов (127+).
Решение: переводить все в юникод, причем 16-битный, потому что в 8-битном если пропустить код выбора страницы то будет дефолтовая системная, т.е. он все равно привязан к кодпэйджам. И вообще все надо переводить на ARM.
Цитата: Vertaler от февраля 7, 2008, 16:17Нелепость за нелепостью. Полный бред: каждому языку - по отдельной таблице. До какой же степени надо быть врагом языков человеческих и их письменности.Цитата: Тайльнемер от февраля 7, 2008, 14:30Цитата: Vertaler от февраля 6, 2008, 15:00А можно поподробнее, что предлагается? По отдельной таблице для каждого чего?
Всё это часть одной большой проблемы — что юникод с самого начала нужно было делать по языковому принципу, а не по просто алфавитному
В применении к турецкому это как будет выглядеть? Все символы турецкого алфавита в отдельной таблице что ли?Цитировать1. Не «предлагается», а уже существует в уникоде. Только суть в том, что это не целевая программа Юникода, а вынужденное подстраивание под реальные нужды. А целевая программа Юникода — это раздача таблиц по неким не очень понятным принципам, подразумевающим то ли общность алфавита, то ли ещё что. Плюс, в Юникоде «умные» головы отменили использовавшийся прежде принцип — каждой букве отдельное место в уникоде, теперь же используется совершенно неудобные принцип, по которому буквы с диакритиками образуются при помощи основной буквы и навесной диакритики. При это совершенно не учитывается, что далеко-далеко не все программы поддерживают опентайп, да и создавать опентайпные шрифты несравнимо сложнее, чем простые трутайп.
2. По поводу скриптового принципа: каждой скрипте (вы должны знать, что это такое, иначе объяснять бесполезно) — отдельную таблицу. Сейчас это есть, например, по отношению к латинскому алфавиту и его италийскому предку, — которые разнесены по разным таблицам; с другой стороны, русский и старославянский алфавиты объединены в одной таблице, что не даёт возможности использовать единый шрифт для написания текстов одновременно на современных языках, использующих русский алфавит, и на старославянском, — требуется как минимум два шрифта. То же самое можно сказать, например, о латинской готической скрипте и антикве; о древнегреских скриптах, византийской и современной греческой, которые тоже объединены в одну таблицу, принуждая исследователя исследователя использовать несколько шрифтов. Нужно ли говорить, что это совершенно неудобно.
Что касается турецкого и сербского, то здесь Менш предлагает — таки да, отдельную таблицу, хотя я бы удовольствовался введением букв İi и Iı для турецкого, а для сербского с македонским — введением отдельных п, т, г, б.
Цитата: Vertaler от февраля 6, 2008, 15:00Чушь!
Всё это часть одной большой проблемы — что юникод с самого начала нужно было делать по языковому принципу, а не по просто алфавитному.
Цитата: Тайльнемер от февраля 7, 2008, 14:30Цитата: Vertaler от февраля 6, 2008, 15:00А можно поподробнее, что предлагается? По отдельной таблице для каждого чего?
Всё это часть одной большой проблемы — что юникод с самого начала нужно было делать по языковому принципу, а не по просто алфавитному
В применении к турецкому это как будет выглядеть? Все символы турецкого алфавита в отдельной таблице что ли?
Цитировать1. Не «предлагается», а уже существует в уникоде. Только суть в том, что это не целевая программа Юникода, а вынужденное подстраивание под реальные нужды. А целевая программа Юникода — это раздача таблиц по неким не очень понятным принципам, подразумевающим то ли общность алфавита, то ли ещё что. Плюс, в Юникоде «умные» головы отменили использовавшийся прежде принцип — каждой букве отдельное место в уникоде, теперь же используется совершенно неудобные принцип, по которому буквы с диакритиками образуются при помощи основной буквы и навесной диакритики. При это совершенно не учитывается, что далеко-далеко не все программы поддерживают опентайп, да и создавать опентайпные шрифты несравнимо сложнее, чем простые трутайп.
2. По поводу скриптового принципа: каждой скрипте (вы должны знать, что это такое, иначе объяснять бесполезно) — отдельную таблицу. Сейчас это есть, например, по отношению к латинскому алфавиту и его италийскому предку, — которые разнесены по разным таблицам; с другой стороны, русский и старославянский алфавиты объединены в одной таблице, что не даёт возможности использовать единый шрифт для написания текстов одновременно на современных языках, использующих русский алфавит, и на старославянском, — требуется как минимум два шрифта. То же самое можно сказать, например, о латинской готической скрипте и антикве; о древнегреских скриптах, византийской и современной греческой, которые тоже объединены в одну таблицу, принуждая исследователя исследователя использовать несколько шрифтов. Нужно ли говорить, что это совершенно неудобно.
Цитата: Vertaler от февраля 6, 2008, 15:00А можно поподробнее, что предлагается? По отдельной таблице для каждого чего?
Всё это часть одной большой проблемы — что юникод с самого начала нужно было делать по языковому принципу, а не по просто алфавитному
Цитата: Vertaler от февраля 6, 2008, 15:00
Подробнее об этом можно почитать тут:
http://wolliger-mensch.livejournal.com/22308.html
Страница создана за 0.062 сек. Запросов: 23.