Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Вопрос живущим вне России про имена доменов на кириллице

Автор Ильич, февраля 8, 2016, 15:43

0 Пользователи и 1 гость просматривают эту тему.

wandrien

Цитата: Hellerick от февраля 11, 2016, 08:41
Нужно еще учитывать, для подавляющего большинства программистов возиться с системой иной, нежели «1 код = 1 символ» — неприемлемая дурь. Это нам интересно возиться с яналифами, а у вменяемых людей есть более насущные задачи, которые нельзя усложнять из-за символов, которые на практике использоваться не будут.
Программистов жизнь заставиляет помаленьку. Не поддерживать поток utf-8 хотя бы на уровне "чо написано не знаю, но буквы не порчу - уже хорошо" считается плохим тоном. Надо давить дальше.  8-)

Hellerick

Я вот чувствую, что задача эта должна решаться через какие-нибудь "частные расширения" Юникода.

Присвоить какой-нибудь юникодовской позиции значение подключения дополнительной карты символов, за которым должен идти URL этой карты. А в карте стандартным образом расписаны коды символов, их семантика, связи между ними (какие являются строчными и заглавными вариантами друг друга, какие получены диакритикой из других символов и т. п.)

И не надо будет клингонцам приставить к Консорциуму, чтобы включили в стандарт их закорючки — просто заведут для них собственную страничку.

Bhudh

Цитата: wandrien от февраля 11, 2016, 05:25Зато всякие č, š, ž, принадлежащие одному и тому же алфавиту, можно закодировать двумя разными последовательностями юникода, и не все программы понимают, что обе последовательности - это одна и та же буква.
Это о чём? О прекомбайнах vs. буква+комбайн? :???
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

wandrien

Цитата: Bhudh от февраля 11, 2016, 11:28
Цитата: wandrien от февраля 11, 2016, 05:25Зато всякие č, š, ž, принадлежащие одному и тому же алфавиту, можно закодировать двумя разными последовательностями юникода, и не все программы понимают, что обе последовательности - это одна и та же буква.
Это о чём? О прекомбайнах vs. буква+комбайн? :???
Ага. Вот буквально на днях на memrise-е наткнулся на эти грабли.

Bhudh

Ну так последовательность и не есть буква. Чисто побайтно.
А семантику последовательностей надо уже отдельно запиливать, и для прог, не являющихся текстовыми редакторами/процессорами мало кто этим будет заниматься.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

wandrien

Цитата: Bhudh от февраля 11, 2016, 11:42
А семантику последовательностей надо уже отдельно запиливать, и для прог, не являющихся текстовыми редакторами/процессорами мало кто этим будет заниматься.
Как бы то ни было, это много где надо и мало где делается.
Как оказалось, аж на целом портале, посвященном изучению языков, нет нормализации комбайнов.

Тайльнемер

Цитата: wandrien от февраля 11, 2016, 08:37
Чтобы не было такого беспорядка как с буквой i. Если для латинской и турецкой i правила капитализации не совпадают, это должны быть разные буквы.
Это, конечно, безобразие.
Здесь, кажется, уникодовцы руководствовались принципами однозначности преобразования в уникод старых стандартных кодовых страниц. В турецкой кодировке когда-то не удосужились ввести отдельную букву, уникод это просто унаследовал для совместимости.

Кстати, это единственный случай, когда от языка зависит результат преобразования регистра? Вроде бы, в каком-то языке есть традиция не вешать диакритики на заглавные буквы. С капитализацией эсцета тоже как-то всё плохо.

Bhudh

Цитата: wandrien от февраля 11, 2016, 11:48Как оказалось, аж на целом портале, посвященном изучению языков, нет нормализации комбайнов.
www.unipad.org Вам в помощь.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Тайльнемер

Да, вот яналифная Bʙ тоже по-хорошему должна бы быть отдельной парой букв.

wandrien

Цитата: Bhudh от февраля 11, 2016, 11:50
Цитата: wandrien от февраля 11, 2016, 11:48Как оказалось, аж на целом портале, посвященном изучению языков, нет нормализации комбайнов.
www.unipad.org Вам в помощь.
При чем тут unipad, если сайт у вас спрашивает, например, "Напишите слово печь по-сербски", и с вероятностью 50% ответ peć будет неправильным.
На самом деле конечно ситуация не столь плачевная, всего в паре уроков попадался этот баг, и кнопка Ignore спасает. Просто кто-то набрал несколько слов не прекомбайнами, а комбинациями c + модификатор. Но баг есть баг.


Bhudh

То есть у них там ответы вбиты с комбайнами? Это уже печально, источники им надо лучше выбирать.
А то так можно ж и из неуникодного пэдээфа скопипастить.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

DarkMax2

Цитата: Тайльнемер от февраля 10, 2016, 06:54
Цитата: Hellerick от февраля  9, 2016, 17:29
Другое дело, что ему следовало сопровождаться принятием упорядочивающих правил, но этот шанс был как обычно упущен.
Вы о чём? Правил чего?

Цитата: DarkMax2 от февраля  9, 2016, 17:52
Цитата: Тайльнемер от февраля  9, 2016, 08:41
Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Это уже проблема образования.
Не совсем. Ведь не угадаешь, настроен ли собеседник в данный момент на восприятие («русского извода») латинских названий или английских.
Если произнесение английского названия буквы R как «а», конфликтующее с латинским названием A, ещё можно с натягом назвать проблемой образования (согласно правилам практической транскрипции «р» в названии должно присутствовать), то буква «и» создаёт путаницу независимо от образования, если другие буквы при этом не выдают своей принадлежности («эф», «эл», «эм», «эн», «эс»).
Математические названия литер знаете?
Tej wojny nikt za nas nie wygra! © Wiedźmin III
Коли зчинять лемент: "Хто ж знав?!" — відповімо: "Ми".

З моїх снів ти утечеш над ранок,
Терпка, як аґрус, солодка, як біз.
Хочу снить чорні локи сплута́ні,
Фіалкові очі, мокрі від сліз.

Тайльнемер

Цитата: DarkMax2 от февраля 11, 2016, 12:23
Математические названия литер знаете?
А как же! А толку? Это же не единственный способ их называть.

злой

Цитата: wandrien от февраля 11, 2016, 11:48
Как оказалось, аж на целом портале, посвященном изучению языков, нет нормализации комбайнов



Entre los individuos, como entre las naciones, el respeto al derecho ajeno es la paz.   - Benito Juárez

wandrien


Hellerick


Bhudh

Цитата: Running UniPad in unregistered mode is free for anyone. Unregistered mode allows viewing of documents without limitiation. Editing is session limited. If you register you will be able to run UniPad in registered mode and this limit will be removed.
Мне незарегистрированной версии за глаза.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Hellerick

Я, вроде бы, раньше им пользовался, и ограничение как-то само собой пропадало.

Bhudh

У меня тоже куда-то пропала надпись [Unregistered] в шапке. Хотя в About написано «This copy is unregistered».
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр