Author Topic: Вопрос живущим вне России про имена доменов на кириллице  (Read 5285 times)

0 Members and 1 Guest are viewing this topic.

Offline Bhudh

  • Posts: 53417
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
Чегой-то в рувики редирект с urlencode стоит на IRI, а в en-wiki на percent-encoding…
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Offline Тайльнемер

  • Posts: 12728
  • Σοι υν βυρρο. Ix bin æn ézl
Другое дело, что ему следовало сопровождаться принятием упорядочивающих правил, но этот шанс был как обычно упущен.
Вы о чём? Правил чего?

Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Это уже проблема образования.
Не совсем. Ведь не угадаешь, настроен ли собеседник в данный момент на восприятие («русского извода») латинских названий или английских.
Если произнесение английского названия буквы R как «а», конфликтующее с латинским названием A, ещё можно с натягом назвать проблемой образования (согласно правилам практической транскрипции «р» в названии должно присутствовать), то буква «и» создаёт путаницу независимо от образования, если другие буквы при этом не выдают своей принадлежности («эф», «эл», «эм», «эн», «эс»).

Offline Ильич

  • Posts: 8349
  • Gender: Male
Ведь не угадаешь, настроен ли собеседник в данный момент на восприятие («русского извода») латинских названий или английских.
Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими. Но стоит сказать "си", так переспрашивают, что это за буква. И диктуешь, как тут писали "как русская эс", "как галочка", ...
Добавлю. h как "аш" обычно понимают.

Online злой

  • Posts: 10648
  • Gender: Male
Никакой кодировки в доменах кроме ASCII нету. Т.н. нелатинские домены кодируются с помощью punycode, а браузеры уже сами правильно их отображают

И здесь кидалово....
Lorem ipsum dolor sit amet

Offline Bhudh

  • Posts: 53417
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими.
;D А Вы не пробовали уточнять, что они понимают под "латинскими"?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Offline Hellerick

  • Posts: 26662
  • Gender: Male
Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими.
;D А Вы не пробовали уточнять, что они понимают под "латинскими"?

Нас в школе наш латинянин учил:

А бэ кэ дэ эф ɦо...

Offline Upliner

  • Posts: 3764
  • Gender: Male
  • Blanklanugbesto
Никакой кодировки в доменах кроме ASCII нету. Т.н. нелатинские домены кодируются с помощью punycode, а браузеры уже сами правильно их отображают

И здесь кидалово....
А для пользователя какая разница, как это технически реализовано?
Однако, если вы настраиваете сервера, конечно нужно знать, что из себя представляют кириллические домены и как кодируются нелатинские URI. Большинство хостингов конечно за вас это делают сами, но если их функционала не хватаит и хотите поднять хотя бы свой VPS -- приходится разбираться.
Мы, видите ли, винтили вентили аж квинтиллион раз!

Offline Ильич

  • Posts: 8349
  • Gender: Male
Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими.
;D А Вы не пробовали уточнять, что они понимают под "латинскими"?
Нет. У меня в этих случаях другая задача: сообщить собеседнику адрес электронной почты или сайта.

Нас в школе наш латинянин учил:
А бэ кэ дэ эф ɦо...
Бедное "е".
У меня а, бэ, це, дэ, э, эф, гэ, ха, ...

Offline Bhudh

  • Posts: 53417
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
Открыл форзац «Геометрии» Погорелова.
Quote from:
а, бэ, цэ, дэ, э, эф, же, аш, и, йот (жи), ка, эль, эм,
эн, о, пэ, ку, эр, эс, тэ, у, вэ, дубль-вэ, икс, игрек, зэт

Плюс «Некоторые буквы греческого алфавита»:
Quote from:
альфа, бета, гамма, дельта, ламбда, мю,
пи, ро, тау, фи, пси, омега
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Online злой

  • Posts: 10648
  • Gender: Male
Открыл форзац «Геометрии» Погорелова.

Ваши дети учатся по Погорелову? Или забыли сдать в школьную библиотеку? ;D
Lorem ipsum dolor sit amet

Offline Bhudh

  • Posts: 53417
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
Забыл. :green: 92-го года учебник.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Online злой

  • Posts: 10648
  • Gender: Male
А для пользователя какая разница, как это технически реализовано?

Есть разница. Она проявляется, когда возникают какие-то проблемы.
Lorem ipsum dolor sit amet

Offline Upliner

  • Posts: 3764
  • Gender: Male
  • Blanklanugbesto
Есть разница. Она проявляется, когда возникают какие-то проблемы.
Например? Если админ неправильно настроил сервак, то крякозябры пользователю скажут больше, чем комбинации латинских букв?
Мы, видите ли, винтили вентили аж квинтиллион раз!

Online Python

  • Posts: 37546
  • Gender: Male
  • Aluarium agent
Но никогда не понимал смысла этого изврата - адреса кириллицей.
Я только один смысл вижу. ivanov.ru занят, а иванов.рф свободен.
Ну что вы? «Извратом» я бы скорее назвал необходимость прибегать к транслитерации в латиницу (а то и к переводу на альбионский).
Во-первых, единой системы транлитерации у нас нету, и вариантов написания одного и того же слова может быть уйма. Запомнить имя домена транслитом сложнее, больше вероятность наткнуться на фишеров. Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Во-вторых, читаемость. Транслит читается туго, особенно без пробелов.
Для русского кириллизация доменов, может, и имеет смысл, а в украинском получилось, как всегда, еще хуже. Из-за апострофа (пусть и не самого частого символа, но обязательного для написания во многих украинских словах): стандарт не позволяет использовать в доменах ни обычный ascii-шный апостроф ('), ни «типографический» апостроф-кавычку (’). В результате, в таких именах решили использовать «буквенный апостроф» (ʼ), на большинстве украинских раскладок отсутствующий. Ну и как такой адрес вводить? В «расширенной» украинской раскладке, поставляемой с виндой начиная с висты, есть только запрещенный в именах апостроф из основного ascii.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Offline Hellerick

  • Posts: 26662
  • Gender: Male
Русские буквы вроде Э и Ъ в укродомене запрещены?

Online Python

  • Posts: 37546
  • Gender: Male
  • Aluarium agent
Русские буквы вроде Э и Ъ в укродомене запрещены?
Нет, вроде бы. Насколько я помню, сразу после создания .укр в нем был разрешен весь русский (а не украинский!) алфавит.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Offline wandrien

  • Posts: 4950
Из-за апострофа (пусть и не самого частого символа, но обязательного для написания во многих украинских словах): стандарт не позволяет использовать в доменах ни обычный ascii-шный апостроф ('), ни «типографический» апостроф-кавычку (’). В результате, в таких именах решили использовать «буквенный апостроф» (ʼ), на большинстве украинских раскладок отсутствующий.
:fp: Маразм крепчал! Сочувствую.

А почему не позволяет? Вот не пофиг им было, всё равно же юникод в основе лежит?
Умело сочетаю отсутствие каких-либо талантов с отсутствием жизненных целей.

Мне нечего сказать миру - я не разговариваю с вымышленными персонажами.

Ваша свобода находится здесь и сейчас, прямо под слоем эмоций.

Offline Hellerick

  • Posts: 26662
  • Gender: Male
Из-за апострофа (пусть и не самого частого символа, но обязательного для написания во многих украинских словах): стандарт не позволяет использовать в доменах ни обычный ascii-шный апостроф ('), ни «типографический» апостроф-кавычку (’). В результате, в таких именах решили использовать «буквенный апостроф» (ʼ), на большинстве украинских раскладок отсутствующий.
:fp: Маразм крепчал! Сочувствую.

А почему не позволяет? Вот не пофиг им было, всё равно же юникод в основе лежит?

Ну, если руководствоваться сухой логикой, то, пожалуй, неправильной является раскладка. Ее и следует менять.

Online Python

  • Posts: 37546
  • Gender: Male
  • Aluarium agent
А почему не позволяет? Вот не пофиг им было, всё равно же юникод в основе лежит?
Тем не менее, в доменных именах некоторые символы-ограничители (апостроф, кавычки — из базового ascii и из дополнительного набора) запрещены. Впрочем, действительно, несовсем понятно, зачем запрет распространили за пределы базового ascii, если в коде программы или html эти дополнительные символы в качестве ограничителей никто не использует.
Ну, если руководствоваться сухой логикой, то, пожалуй, неправильной является раскладка. Ее и следует менять.
Ждать еще лет 10-15, пока Майкрософт решит заменить апостроф в раскладке? Спасибо, что хоть этот добавили вместо долго висевшей там буквы ё. Да, и проблема совместимости с ранее напечатанными текстами, в которых преобладает простой апостроф.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Offline wandrien

  • Posts: 4950
Ну, если руководствоваться сухой логикой, то, пожалуй, неправильной является раскладка. Ее и следует менять.
А у нас везде так: "это не моя область ответственности, пусть исправляют вон те, а я всё и так делаю правильно". Это глобальная проблема индустрии. Торвальдс единственный инженер на моей памяти, который гнобит за такое мышление и заставляет исправлять проблемы совместимости тогда и там, когда и где они возникают, а не переписывать то, что давно работает.

Конкретно в данном случае, если я правильно понимаю, апостроф не является специальным символом в имени доменов (в отличие от точки, слеша, двоеточия), поэтому ничего не мешало разрешить его использовать.

Ну и юникод сам по себе ущербен, т.к оперирует сущностями в себе, оторванными от реального их применения.
Если делать по уму, следовало сразу заводить отдельные пространства на каждый отдельный алфавит, если эти алфавиты отличаются хоть одной буквой или деталями семантики. А сейчас даже букву i в upper case не сконвертировать без знания языка, в котором она написана.  :3tfu:
Зато всякие č, š, ž, принадлежащие одному и тому же алфавиту, можно закодировать двумя разными последовательностями юникода, и не все программы понимают, что обе последовательности - это одна и та же буква.
 :uzhos:
Умело сочетаю отсутствие каких-либо талантов с отсутствием жизненных целей.

Мне нечего сказать миру - я не разговариваю с вымышленными персонажами.

Ваша свобода находится здесь и сейчас, прямо под слоем эмоций.

Online Awwal12

  • Super Moderator
  • *
  • Posts: 57371
  • Gender: Male
Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Это уже проблема образования.
Если вам, например, нужно что-то надиктовать клиенту, то это ваша проблема, а не проблема образования...
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

Offline Тайльнемер

  • Posts: 12728
  • Σοι υν βυρρο. Ix bin æn ézl
Offtop
Если делать по уму, следовало сразу заводить отдельные пространства на каждый отдельный алфавит, если эти алфавиты отличаются хоть одной буквой или деталями семантики.
Ну, эта крайность тоже имеет уйму своих недостатков. Я бы сказал, их даже больше чем в уникоде.

Возьмём, например, азербайджанскую латиницу.
Вика пишет, что с 1925 г. ввели один вариант яналифа, в 1933-м заменили на другой, отличающийся несколькими буквами, в 1938-м отменили букву ŋ, потом в 1992-м появилась новая латиница, и тут же она подверглась ещё одной правке — ä заменили на ə.
Что же, включать в кодировку все пять азербайджанских латиниц как совершенно разные алфавиты? А проекты?
А завтра, например, введут ещё одну букву, какую-нибудь á, которая уже давно есть в уникоде, и люди могли бы просто обновить раскладку, чтобы ей пользоваться. Но с вашим подходом им придётся перейти на другую облать кодировки и полностью другими код-поинтами для тех же букв. И большинство программ ничего не будет знать о соответствиях между ними (пока их не удосужатся обновить) и, например, чтобы найти слово тексте, нужно будет сперва понять, дореформенный он или нет, и в зависимости от этого поставить старую или новую раскладку, и набрать его в ней (даже если в этом слове нет злополучной буквы á). А сколько появится смешанных текстов, которые редактировали в разных алфавитах.

Offline wandrien

  • Posts: 4950
Что же, включать в кодировку все пять азербайджанских латиниц как совершенно разные алфавиты? А проекты?
Дааа, это перебор.  :what:
Значит, как минимум, надо жестко прописывать семантику символам. Чтобы не было такого беспорядка как с буквой i. Если для латинской и турецкой i правила капитализации не совпадают, это должны быть разные буквы.  :???
Умело сочетаю отсутствие каких-либо талантов с отсутствием жизненных целей.

Мне нечего сказать миру - я не разговариваю с вымышленными персонажами.

Ваша свобода находится здесь и сейчас, прямо под слоем эмоций.

Offline Hellerick

  • Posts: 26662
  • Gender: Male
Нужно еще учитывать, для подавляющего большинства программистов возиться с системой иной, нежели «1 код = 1 символ» — неприемлемая дурь. Это нам интересно возиться с яналифами, а у вменяемых людей есть более насущные задачи, которые нельзя усложнять из-за символов, которые на практике использоваться не будут.

 

With Quick-Reply you can write a post when viewing a topic without loading a new page. You can still use bulletin board code and smileys as you would in a normal post.

Note: this post will not display until it's been approved by a moderator.
Name: Email:
Verification:
Type the letters shown in the picture
Listen to the letters / Request another image
Type the letters shown in the picture:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: