Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Вопрос живущим вне России про имена доменов на кириллице

Автор Ильич, февраля 8, 2016, 15:43

0 Пользователи и 1 гость просматривают эту тему.

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Тайльнемер

Цитата: Hellerick от февраля  9, 2016, 17:29
Другое дело, что ему следовало сопровождаться принятием упорядочивающих правил, но этот шанс был как обычно упущен.
Вы о чём? Правил чего?

Цитата: DarkMax2 от февраля  9, 2016, 17:52
Цитата: Тайльнемер от февраля  9, 2016, 08:41
Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Это уже проблема образования.
Не совсем. Ведь не угадаешь, настроен ли собеседник в данный момент на восприятие («русского извода») латинских названий или английских.
Если произнесение английского названия буквы R как «а», конфликтующее с латинским названием A, ещё можно с натягом назвать проблемой образования (согласно правилам практической транскрипции «р» в названии должно присутствовать), то буква «и» создаёт путаницу независимо от образования, если другие буквы при этом не выдают своей принадлежности («эф», «эл», «эм», «эн», «эс»).

Ильич

Цитата: Тайльнемер от февраля 10, 2016, 06:54
Ведь не угадаешь, настроен ли собеседник в данный момент на восприятие («русского извода») латинских названий или английских.
Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими. Но стоит сказать "си", так переспрашивают, что это за буква. И диктуешь, как тут писали "как русская эс", "как галочка", ...
Добавлю. h как "аш" обычно понимают.

злой

Цитата: Rwseg от февраля  9, 2016, 18:51
Никакой кодировки в доменах кроме ASCII нету. Т.н. нелатинские домены кодируются с помощью punycode, а браузеры уже сами правильно их отображают

И здесь кидалово....
Entre los individuos, como entre las naciones, el respeto al derecho ajeno es la paz.   - Benito Juárez

Bhudh

Цитата: Ильич от февраля 10, 2016, 11:17Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими.
;D А Вы не пробовали уточнять, что они понимают под "латинскими"?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Hellerick

Цитата: Bhudh от февраля 10, 2016, 11:31
Цитата: Ильич от февраля 10, 2016, 11:17Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими.
;D А Вы не пробовали уточнять, что они понимают под "латинскими"?

Нас в школе наш латинянин учил:

А бэ кэ дэ эф ɦо...

Upliner

Цитата: злой от февраля 10, 2016, 11:28
Цитата: Rwseg от февраля  9, 2016, 18:51
Никакой кодировки в доменах кроме ASCII нету. Т.н. нелатинские домены кодируются с помощью punycode, а браузеры уже сами правильно их отображают

И здесь кидалово....
А для пользователя какая разница, как это технически реализовано?
Однако, если вы настраиваете сервера, конечно нужно знать, что из себя представляют кириллические домены и как кодируются нелатинские URI. Большинство хостингов конечно за вас это делают сами, но если их функционала не хватаит и хотите поднять хотя бы свой VPS -- приходится разбираться.
Sancta Maria, Mater Dei, ora pro nobis peccatoribus, nunc et in hora mortis nostrae.

Ильич

Цитата: Bhudh от февраля 10, 2016, 11:31
Цитата: Ильич от февраля 10, 2016, 11:17Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими.
;D А Вы не пробовали уточнять, что они понимают под "латинскими"?
Нет. У меня в этих случаях другая задача: сообщить собеседнику адрес электронной почты или сайта.

Ильич


Bhudh

Открыл форзац «Геометрии» Погорелова.
Цитата: а, бэ, цэ, дэ, э, эф, же, аш, и, йот (жи), ка, эль, эм,
эн, о, пэ, ку, эр, эс, тэ, у, вэ, дубль-вэ, икс, игрек, зэт

Плюс «Некоторые буквы греческого алфавита»:
Цитата: альфа, бета, гамма, дельта, ламбда, мю,
пи, ро, тау, фи, пси, омега
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

злой

Цитата: Bhudh от февраля 10, 2016, 12:22
Открыл форзац «Геометрии» Погорелова.

Ваши дети учатся по Погорелову? Или забыли сдать в школьную библиотеку? ;D
Entre los individuos, como entre las naciones, el respeto al derecho ajeno es la paz.   - Benito Juárez

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

злой

Цитата: Upliner от февраля 10, 2016, 12:01
А для пользователя какая разница, как это технически реализовано?

Есть разница. Она проявляется, когда возникают какие-то проблемы.
Entre los individuos, como entre las naciones, el respeto al derecho ajeno es la paz.   - Benito Juárez

Upliner

Цитата: злой от февраля 10, 2016, 13:12
Есть разница. Она проявляется, когда возникают какие-то проблемы.
Например? Если админ неправильно настроил сервак, то крякозябры пользователю скажут больше, чем комбинации латинских букв?
Sancta Maria, Mater Dei, ora pro nobis peccatoribus, nunc et in hora mortis nostrae.

Python

Цитата: Тайльнемер от февраля  9, 2016, 08:41
Цитата: Ильич от февраля  8, 2016, 17:50
Цитата: DarkMax2 от февраля  8, 2016, 16:28Но никогда не понимал смысла этого изврата - адреса кириллицей.
Я только один смысл вижу. //ivanov.ru занят, а //иванов.рф свободен.
Ну что вы? «Извратом» я бы скорее назвал необходимость прибегать к транслитерации в латиницу (а то и к переводу на альбионский).
Во-первых, единой системы транлитерации у нас нету, и вариантов написания одного и того же слова может быть уйма. Запомнить имя домена транслитом сложнее, больше вероятность наткнуться на фишеров. Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Во-вторых, читаемость. Транслит читается туго, особенно без пробелов.
Для русского кириллизация доменов, может, и имеет смысл, а в украинском получилось, как всегда, еще хуже. Из-за апострофа (пусть и не самого частого символа, но обязательного для написания во многих украинских словах): стандарт не позволяет использовать в доменах ни обычный ascii-шный апостроф ('), ни «типографический» апостроф-кавычку ('). В результате, в таких именах решили использовать «буквенный апостроф» (ʼ), на большинстве украинских раскладок отсутствующий. Ну и как такой адрес вводить? В «расширенной» украинской раскладке, поставляемой с виндой начиная с висты, есть только запрещенный в именах апостроф из основного ascii.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2


Python

Цитата: Hellerick от февраля 10, 2016, 14:01
Русские буквы вроде Э и Ъ в укродомене запрещены?
Нет, вроде бы. Насколько я помню, сразу после создания .укр в нем был разрешен весь русский (а не украинский!) алфавит.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

wandrien

Цитата: Python от февраля 10, 2016, 13:46
Из-за апострофа (пусть и не самого частого символа, но обязательного для написания во многих украинских словах): стандарт не позволяет использовать в доменах ни обычный ascii-шный апостроф ('), ни «типографический» апостроф-кавычку ('). В результате, в таких именах решили использовать «буквенный апостроф» (ʼ), на большинстве украинских раскладок отсутствующий.
:fp: Маразм крепчал! Сочувствую.

А почему не позволяет? Вот не пофиг им было, всё равно же юникод в основе лежит?

Hellerick

Цитата: wandrien от февраля 11, 2016, 03:42
Цитата: Python от февраля 10, 2016, 13:46
Из-за апострофа (пусть и не самого частого символа, но обязательного для написания во многих украинских словах): стандарт не позволяет использовать в доменах ни обычный ascii-шный апостроф ('), ни «типографический» апостроф-кавычку ('). В результате, в таких именах решили использовать «буквенный апостроф» (ʼ), на большинстве украинских раскладок отсутствующий.
:fp: Маразм крепчал! Сочувствую.

А почему не позволяет? Вот не пофиг им было, всё равно же юникод в основе лежит?

Ну, если руководствоваться сухой логикой, то, пожалуй, неправильной является раскладка. Ее и следует менять.

Python

Цитата: wandrien от февраля 11, 2016, 03:42
А почему не позволяет? Вот не пофиг им было, всё равно же юникод в основе лежит?
Тем не менее, в доменных именах некоторые символы-ограничители (апостроф, кавычки — из базового ascii и из дополнительного набора) запрещены. Впрочем, действительно, несовсем понятно, зачем запрет распространили за пределы базового ascii, если в коде программы или html эти дополнительные символы в качестве ограничителей никто не использует.
Цитата: Hellerick от февраля 11, 2016, 03:50
Ну, если руководствоваться сухой логикой, то, пожалуй, неправильной является раскладка. Ее и следует менять.
Ждать еще лет 10-15, пока Майкрософт решит заменить апостроф в раскладке? Спасибо, что хоть этот добавили вместо долго висевшей там буквы ё. Да, и проблема совместимости с ранее напечатанными текстами, в которых преобладает простой апостроф.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

wandrien

Цитата: Hellerick от февраля 11, 2016, 03:50
Ну, если руководствоваться сухой логикой, то, пожалуй, неправильной является раскладка. Ее и следует менять.
А у нас везде так: "это не моя область ответственности, пусть исправляют вон те, а я всё и так делаю правильно". Это глобальная проблема индустрии. Торвальдс единственный инженер на моей памяти, который гнобит за такое мышление и заставляет исправлять проблемы совместимости тогда и там, когда и где они возникают, а не переписывать то, что давно работает.

Конкретно в данном случае, если я правильно понимаю, апостроф не является специальным символом в имени доменов (в отличие от точки, слеша, двоеточия), поэтому ничего не мешало разрешить его использовать.

Ну и юникод сам по себе ущербен, т.к оперирует сущностями в себе, оторванными от реального их применения.
Если делать по уму, следовало сразу заводить отдельные пространства на каждый отдельный алфавит, если эти алфавиты отличаются хоть одной буквой или деталями семантики. А сейчас даже букву i в upper case не сконвертировать без знания языка, в котором она написана.  :3tfu:
Зато всякие č, š, ž, принадлежащие одному и тому же алфавиту, можно закодировать двумя разными последовательностями юникода, и не все программы понимают, что обе последовательности - это одна и та же буква.
:uzhos:

Awwal12

Цитата: DarkMax2 от февраля  9, 2016, 17:52
Цитата: Тайльнемер от февраля  9, 2016, 08:41
Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Это уже проблема образования.
Если вам, например, нужно что-то надиктовать клиенту, то это ваша проблема, а не проблема образования...
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

Тайльнемер

Offtop
Цитата: wandrien от февраля 11, 2016, 05:25
Если делать по уму, следовало сразу заводить отдельные пространства на каждый отдельный алфавит, если эти алфавиты отличаются хоть одной буквой или деталями семантики.
Ну, эта крайность тоже имеет уйму своих недостатков. Я бы сказал, их даже больше чем в уникоде.

Возьмём, например, азербайджанскую латиницу.
Вика пишет, что с 1925 г. ввели один вариант яналифа, в 1933-м заменили на другой, отличающийся несколькими буквами, в 1938-м отменили букву ŋ, потом в 1992-м появилась новая латиница, и тут же она подверглась ещё одной правке — ä заменили на ə.
Что же, включать в кодировку все пять азербайджанских латиниц как совершенно разные алфавиты? А проекты?
А завтра, например, введут ещё одну букву, какую-нибудь á, которая уже давно есть в уникоде, и люди могли бы просто обновить раскладку, чтобы ей пользоваться. Но с вашим подходом им придётся перейти на другую облать кодировки и полностью другими код-поинтами для тех же букв. И большинство программ ничего не будет знать о соответствиях между ними (пока их не удосужатся обновить) и, например, чтобы найти слово тексте, нужно будет сперва понять, дореформенный он или нет, и в зависимости от этого поставить старую или новую раскладку, и набрать его в ней (даже если в этом слове нет злополучной буквы á). А сколько появится смешанных текстов, которые редактировали в разных алфавитах.

wandrien

Цитата: Тайльнемер от февраля 11, 2016, 08:23
Что же, включать в кодировку все пять азербайджанских латиниц как совершенно разные алфавиты? А проекты?
Дааа, это перебор.  :what:
Значит, как минимум, надо жестко прописывать семантику символам. Чтобы не было такого беспорядка как с буквой i. Если для латинской и турецкой i правила капитализации не совпадают, это должны быть разные буквы.  :???

Hellerick

Нужно еще учитывать, для подавляющего большинства программистов возиться с системой иной, нежели «1 код = 1 символ» — неприемлемая дурь. Это нам интересно возиться с яналифами, а у вменяемых людей есть более насущные задачи, которые нельзя усложнять из-за символов, которые на практике использоваться не будут.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр