Лингвофорум

Общий раздел => Искусство и виртуальная жизнь => Интернет => Тема начата: Ильич от февраля 8, 2016, 15:43

Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Ильич от февраля 8, 2016, 15:43
Случайно обнаружил, что Denwer, который у меня стоит, не воспринимает адрес сайта на кириллице. То есть, адрес на локальном сервере illich/ возможен, а ильич/ нет.
А за пределами России можно набрать в адресной строке набрать, например, кто.рф и попасть на соответствующий сайт?
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: злой от февраля 8, 2016, 15:57
Я из Казахстана попадаю. Но у Казахстана есть свой кириллический домен .қаз
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: wandrien от февраля 8, 2016, 16:01
Разумеется можно, система DNS для всех работает одинаково.
Препятствия могут быть только политические, если где-то какой-то домен забанен.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Ильич от февраля 8, 2016, 16:15
Цитата: злой от февраля  8, 2016, 15:57
Я из Казахстана попадаю. Но у Казахстана есть свой кириллический домен .қаз
А если вы наберете кто.рф казахскими буквами, то куда попадёте?
Название: Вопрос живущим вне России про имена доменов на кирилли
Отправлено: Python от февраля 8, 2016, 16:16
Цитата: Ильич от февраля  8, 2016, 15:43
Случайно обнаружил, что Denwer, который у меня стоит, не воспринимает адрес сайта на кириллице. То есть, адрес на локальном сервере illich/ возможен, а ильич/ нет.
А за пределами России можно набрать в адресной строке набрать, например, кто.рф и попасть на соответствующий сайт?
Попробуйте перекодировать кириллическое название в punicode (напр., с помощью http://fooflo.ru/ ). Это если речь именно о доменных именах, а не папках на одном домене (там обнаруживал другую проблему: Апач читает имена папок в кодировке системы (напр., windows-1251), а браузер использует utf-8 — т.е., папке, чтобы пользователь мог в нее войти, нужно дать имя кракозябликами).
Название: Вопрос живущим вне России про имена доменов на кирилли
Отправлено: Ильич от февраля 8, 2016, 16:25
Цитата: Python от февраля  8, 2016, 16:16Попробуйте перекодировать кириллическое название в punicode (напр., с помощью http://fooflo.ru/ (http://fooflo.ru/) ). Это если речь именно о доменных именах, а не папках на одном домене (там обнаруживал другую проблему: Апач читает имена папок в кодировке системы (напр., windows-1251), а браузер использует utf-8 — т.е., папке, чтобы пользователь мог в нее войти, нужно дать имя кракозябликами).
Понятно, спасибо.
На локальном сервере проще называть папку на латинице, чем кракозябрами адрес писать.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: DarkMax2 от февраля 8, 2016, 16:28
Цитата: Ильич от февраля  8, 2016, 15:43
Случайно обнаружил, что Denwer, который у меня стоит, не воспринимает адрес сайта на кириллице. То есть, адрес на локальном сервере illich/ возможен, а ильич/ нет.
А за пределами России можно набрать в адресной строке набрать, например, кто.рф и попасть на соответствующий сайт?
Попал. Но никогда не понимал смысла этого изврата - адреса кириллицей.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 8, 2016, 17:36
Команда ping в XP-шной консоли этой вашей курилицы не понимает.
ЦитироватьПри проверке связи не удалось обнаружить узел кремль.рф. Проверьте имя узла и по
вторите попытку.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: злой от февраля 8, 2016, 17:39
Цитата: Ильич от февраля  8, 2016, 16:15
Цитата: злой от февраля  8, 2016, 15:57
Я из Казахстана попадаю. Но у Казахстана есть свой кириллический домен .қаз
А если вы наберете кто.рф казахскими буквами, то куда попадёте?

На кто.рф и попадаю  :)
В этом домене нет специфических казахских букв.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Ильич от февраля 8, 2016, 17:45
Цитата: злой от февраля  8, 2016, 17:39На кто.рф и попадаю  :)
В этом домене нет специфических казахских букв.
В каком этом? Но разве кодировки русского "т" и казахского "т" совпадают?
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 8, 2016, 17:50
В Уникоде это одна и та же буква. При чём тут различные Win-кодировки?
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Ильич от февраля 8, 2016, 17:50
Цитата: DarkMax2 от февраля  8, 2016, 16:28Но никогда не понимал смысла этого изврата - адреса кириллицей.
Я только один смысл вижу. ivanov.ru занят, а иванов.рф свободен.
То есть, пространство имен расширилось.
Сейчас три кириллических домена .рф, казахский и .срб.
Но есть и китайский, тамильский и не знаю какие ещё. Думаю, украинский тоже появится.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: DarkMax2 от февраля 8, 2016, 17:57
В Украине домены такого уровня зарезервированы под торговые марки. Держишь торговую марку Фигнятм - получаешь адрес fihnia.ua.
Цитата: Ильич от февраля  8, 2016, 17:50
Сейчас три кириллических домена .рф, казахский и .срб.
Украинский забыли.
президент.укр (http://xn--d1abbgf6aiiy.xn--j1amh)
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Python от февраля 8, 2016, 17:59
Цитата: Bhudh от февраля  8, 2016, 17:36
Команда ping в XP-шной консоли этой вашей курилицы не понимает.
ЦитироватьПри проверке связи не удалось обнаружить узел кремль.рф. Проверьте имя узла и по
вторите попытку.
Значит, нужно пуникодицей пинговать.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: wandrien от февраля 8, 2016, 18:40
Цитата: Bhudh от февраля  8, 2016, 17:36
Команда ping в XP-шной консоли этой вашей курилицы не понимает.
Ну когда эту утилиту для XP писали, никаких юникодных доменов не было.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Leo от февраля 8, 2016, 19:40
Цитата: Ильич от февраля  8, 2016, 15:43
Случайно обнаружил, что Denwer, который у меня стоит, не воспринимает адрес сайта на кириллице. То есть, адрес на локальном сервере illich/ возможен, а ильич/ нет.
А за пределами России можно набрать в адресной строке набрать, например, кто.рф и попасть на соответствующий сайт?
попадаю, но в адресной строке кракозябры
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Ильич от февраля 8, 2016, 19:49
Цитата: DarkMax2 от февраля  8, 2016, 17:57Украинский забыли.
Не забыл, не знал.
Оказывается, есть и .бел и .бг.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 8, 2016, 19:50
Бжий домен?
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Karakurt от февраля 8, 2016, 19:51
Болгария? Сначала подумал, что БиГ.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 8, 2016, 19:51
Цитата: Вы попытались получить доступ к адресу http://бг.бг/, который сейчас недоступен.
Жаль...
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Тайльнемер от февраля 9, 2016, 08:41
Цитата: Ильич от февраля  8, 2016, 17:50
Цитата: DarkMax2 от февраля  8, 2016, 16:28Но никогда не понимал смысла этого изврата - адреса кириллицей.
Я только один смысл вижу. ivanov.ru занят, а иванов.рф свободен.
Ну что вы? «Извратом» я бы скорее назвал необходимость прибегать к транслитерации в латиницу (а то и к переводу на альбионский).
Во-первых, единой системы транлитерации у нас нету, и вариантов написания одного и того же слова может быть уйма. Запомнить имя домена транслитом сложнее, больше вероятность наткнуться на фишеров. Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Во-вторых, читаемость. Транслит читается туго, особенно без пробелов.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Hellerick от февраля 9, 2016, 17:29
Кто-то переводит, кто-то транслитерирует, кто-то чуть ли не ребусы в названиях устраивает — и никакого порядка в этом нет. Появление кириллических доменов в целом полезно. Другое дело, что ему следовало сопровождаться принятием упорядочивающих правил, но этот шанс был как обычно упущен.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: DarkMax2 от февраля 9, 2016, 17:52
Цитата: Тайльнемер от февраля  9, 2016, 08:41
Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Это уже проблема образования.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Rwseg от февраля 9, 2016, 18:51
Цитата: Ильич от февраля  8, 2016, 17:45
Цитата: злой от февраля  8, 2016, 17:39На кто.рф и попадаю  :)
В этом домене нет специфических казахских букв.
В каком этом? Но разве кодировки русского "т" и казахского "т" совпадают?
Я вам по секрету скажу. Никакой кодировки в доменах кроме ASCII нету. Т.н. нелатинские домены кодируются с помощью punycode, а браузеры уже сами правильно их отображают. То есть это просто визуальная обманка. Поэтому никаких «ильич» в адресе у вас быть не может, только ASCII. «Ильич» в строке адреса будет показывать только браузер.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Upliner от февраля 10, 2016, 00:15
Цитата: Rwseg от февраля  9, 2016, 18:51
Цитата: Ильич от февраля  8, 2016, 17:45
Цитата: злой от февраля  8, 2016, 17:39На кто.рф и попадаю  :)
В этом домене нет специфических казахских букв.
В каком этом? Но разве кодировки русского "т" и казахского "т" совпадают?
Я вам по секрету скажу. Никакой кодировки в доменах кроме ASCII нету. Т.н. нелатинские домены кодируются с помощью punycode, а браузеры уже сами правильно их отображают. То есть это просто визуальная обманка. Поэтому никаких «ильич» в адресе у вас быть не может, только ASCII. «Ильич» в строке адреса будет показывать только браузер.
В изначальном сообщении речь идёт даже не о доменах, а о путях, там не punicode, а urlencode. В конечном счёте это конечно тоже ASCII, но перед этим ещё кодируется в utf8. Так вот проблема возникла из-за того, что некоторые кривые серверы игнорируют этотстандарт, фактически просто не поддерживая Unicode.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 10, 2016, 00:42
Чегой-то в рувики редирект с urlencode стоит на IRI, а в en-wiki на percent-encoding...
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Тайльнемер от февраля 10, 2016, 06:54
Цитата: Hellerick от февраля  9, 2016, 17:29
Другое дело, что ему следовало сопровождаться принятием упорядочивающих правил, но этот шанс был как обычно упущен.
Вы о чём? Правил чего?

Цитата: DarkMax2 от февраля  9, 2016, 17:52
Цитата: Тайльнемер от февраля  9, 2016, 08:41
Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Это уже проблема образования.
Не совсем. Ведь не угадаешь, настроен ли собеседник в данный момент на восприятие («русского извода») латинских названий или английских.
Если произнесение английского названия буквы R как «а», конфликтующее с латинским названием A, ещё можно с натягом назвать проблемой образования (согласно правилам практической транскрипции «р» в названии должно присутствовать), то буква «и» создаёт путаницу независимо от образования, если другие буквы при этом не выдают своей принадлежности («эф», «эл», «эм», «эн», «эс»).
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Ильич от февраля 10, 2016, 11:17
Цитата: Тайльнемер от февраля 10, 2016, 06:54
Ведь не угадаешь, настроен ли собеседник в данный момент на восприятие («русского извода») латинских названий или английских.
Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими. Но стоит сказать "си", так переспрашивают, что это за буква. И диктуешь, как тут писали "как русская эс", "как галочка", ...
Добавлю. h как "аш" обычно понимают.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: злой от февраля 10, 2016, 11:28
Цитата: Rwseg от февраля  9, 2016, 18:51
Никакой кодировки в доменах кроме ASCII нету. Т.н. нелатинские домены кодируются с помощью punycode, а браузеры уже сами правильно их отображают

И здесь кидалово....
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 10, 2016, 11:31
Цитата: Ильич от февраля 10, 2016, 11:17Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими.
;D А Вы не пробовали уточнять, что они понимают под "латинскими"?
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Hellerick от февраля 10, 2016, 11:47
Цитата: Bhudh от февраля 10, 2016, 11:31
Цитата: Ильич от февраля 10, 2016, 11:17Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими.
;D А Вы не пробовали уточнять, что они понимают под "латинскими"?

Нас в школе наш латинянин учил:

А бэ кэ дэ эф ɦо...
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Upliner от февраля 10, 2016, 12:01
Цитата: злой от февраля 10, 2016, 11:28
Цитата: Rwseg от февраля  9, 2016, 18:51
Никакой кодировки в доменах кроме ASCII нету. Т.н. нелатинские домены кодируются с помощью punycode, а браузеры уже сами правильно их отображают

И здесь кидалово....
А для пользователя какая разница, как это технически реализовано?
Однако, если вы настраиваете сервера, конечно нужно знать, что из себя представляют кириллические домены и как кодируются нелатинские URI. Большинство хостингов конечно за вас это делают сами, но если их функционала не хватаит и хотите поднять хотя бы свой VPS -- приходится разбираться.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Ильич от февраля 10, 2016, 12:14
Цитата: Bhudh от февраля 10, 2016, 11:31
Цитата: Ильич от февраля 10, 2016, 11:17Я обычно спрашиваю, вам диктовать латинскими буквами или английскими. Всегда говорят: английскими.
;D А Вы не пробовали уточнять, что они понимают под "латинскими"?
Нет. У меня в этих случаях другая задача: сообщить собеседнику адрес электронной почты или сайта.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Ильич от февраля 10, 2016, 12:18
Цитата: Hellerick от февраля 10, 2016, 11:47Нас в школе наш латинянин учил:
А бэ кэ дэ эф ɦо...
Бедное "е".
У меня а, бэ, це, дэ, э, эф, гэ, ха, ...
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 10, 2016, 12:22
Открыл форзац «Геометрии» Погорелова.
Цитата: а, бэ, цэ, дэ, э, эф, же, аш, и, йот (жи), ка, эль, эм,
эн, о, пэ, ку, эр, эс, тэ, у, вэ, дубль-вэ, икс, игрек, зэт

Плюс «Некоторые буквы греческого алфавита»:
Цитата: альфа, бета, гамма, дельта, ламбда, мю,
пи, ро, тау, фи, пси, омега
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: злой от февраля 10, 2016, 12:24
Цитата: Bhudh от февраля 10, 2016, 12:22
Открыл форзац «Геометрии» Погорелова.

Ваши дети учатся по Погорелову? Или забыли сдать в школьную библиотеку? ;D
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 10, 2016, 12:25
Забыл. :green: 92-го года учебник.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: злой от февраля 10, 2016, 13:12
Цитата: Upliner от февраля 10, 2016, 12:01
А для пользователя какая разница, как это технически реализовано?

Есть разница. Она проявляется, когда возникают какие-то проблемы.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Upliner от февраля 10, 2016, 13:22
Цитата: злой от февраля 10, 2016, 13:12
Есть разница. Она проявляется, когда возникают какие-то проблемы.
Например? Если админ неправильно настроил сервак, то крякозябры пользователю скажут больше, чем комбинации латинских букв?
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Python от февраля 10, 2016, 13:46
Цитата: Тайльнемер от февраля  9, 2016, 08:41
Цитата: Ильич от февраля  8, 2016, 17:50
Цитата: DarkMax2 от февраля  8, 2016, 16:28Но никогда не понимал смысла этого изврата - адреса кириллицей.
Я только один смысл вижу. ivanov.ru занят, а иванов.рф свободен.
Ну что вы? «Извратом» я бы скорее назвал необходимость прибегать к транслитерации в латиницу (а то и к переводу на альбионский).
Во-первых, единой системы транлитерации у нас нету, и вариантов написания одного и того же слова может быть уйма. Запомнить имя домена транслитом сложнее, больше вероятность наткнуться на фишеров. Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Во-вторых, читаемость. Транслит читается туго, особенно без пробелов.
Для русского кириллизация доменов, может, и имеет смысл, а в украинском получилось, как всегда, еще хуже. Из-за апострофа (пусть и не самого частого символа, но обязательного для написания во многих украинских словах): стандарт не позволяет использовать в доменах ни обычный ascii-шный апостроф ('), ни «типографический» апостроф-кавычку ('). В результате, в таких именах решили использовать «буквенный апостроф» (ʼ), на большинстве украинских раскладок отсутствующий. Ну и как такой адрес вводить? В «расширенной» украинской раскладке, поставляемой с виндой начиная с висты, есть только запрещенный в именах апостроф из основного ascii.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Hellerick от февраля 10, 2016, 14:01
Русские буквы вроде Э и Ъ в укродомене запрещены?
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Python от февраля 10, 2016, 15:10
Цитата: Hellerick от февраля 10, 2016, 14:01
Русские буквы вроде Э и Ъ в укродомене запрещены?
Нет, вроде бы. Насколько я помню, сразу после создания .укр в нем был разрешен весь русский (а не украинский!) алфавит.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: wandrien от февраля 11, 2016, 03:42
Цитата: Python от февраля 10, 2016, 13:46
Из-за апострофа (пусть и не самого частого символа, но обязательного для написания во многих украинских словах): стандарт не позволяет использовать в доменах ни обычный ascii-шный апостроф ('), ни «типографический» апостроф-кавычку ('). В результате, в таких именах решили использовать «буквенный апостроф» (ʼ), на большинстве украинских раскладок отсутствующий.
:fp: Маразм крепчал! Сочувствую.

А почему не позволяет? Вот не пофиг им было, всё равно же юникод в основе лежит?
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Hellerick от февраля 11, 2016, 03:50
Цитата: wandrien от февраля 11, 2016, 03:42
Цитата: Python от февраля 10, 2016, 13:46
Из-за апострофа (пусть и не самого частого символа, но обязательного для написания во многих украинских словах): стандарт не позволяет использовать в доменах ни обычный ascii-шный апостроф ('), ни «типографический» апостроф-кавычку ('). В результате, в таких именах решили использовать «буквенный апостроф» (ʼ), на большинстве украинских раскладок отсутствующий.
:fp: Маразм крепчал! Сочувствую.

А почему не позволяет? Вот не пофиг им было, всё равно же юникод в основе лежит?

Ну, если руководствоваться сухой логикой, то, пожалуй, неправильной является раскладка. Ее и следует менять.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Python от февраля 11, 2016, 05:21
Цитата: wandrien от февраля 11, 2016, 03:42
А почему не позволяет? Вот не пофиг им было, всё равно же юникод в основе лежит?
Тем не менее, в доменных именах некоторые символы-ограничители (апостроф, кавычки — из базового ascii и из дополнительного набора) запрещены. Впрочем, действительно, несовсем понятно, зачем запрет распространили за пределы базового ascii, если в коде программы или html эти дополнительные символы в качестве ограничителей никто не использует.
Цитата: Hellerick от февраля 11, 2016, 03:50
Ну, если руководствоваться сухой логикой, то, пожалуй, неправильной является раскладка. Ее и следует менять.
Ждать еще лет 10-15, пока Майкрософт решит заменить апостроф в раскладке? Спасибо, что хоть этот добавили вместо долго висевшей там буквы ё. Да, и проблема совместимости с ранее напечатанными текстами, в которых преобладает простой апостроф.
Название: Вопрос живущим вне России про имена доменов на кирилли
Отправлено: wandrien от февраля 11, 2016, 05:25
Цитата: Hellerick от февраля 11, 2016, 03:50
Ну, если руководствоваться сухой логикой, то, пожалуй, неправильной является раскладка. Ее и следует менять.
А у нас везде так: "это не моя область ответственности, пусть исправляют вон те, а я всё и так делаю правильно". Это глобальная проблема индустрии. Торвальдс единственный инженер на моей памяти, который гнобит за такое мышление и заставляет исправлять проблемы совместимости тогда и там, когда и где они возникают, а не переписывать то, что давно работает.

Конкретно в данном случае, если я правильно понимаю, апостроф не является специальным символом в имени доменов (в отличие от точки, слеша, двоеточия), поэтому ничего не мешало разрешить его использовать.

Ну и юникод сам по себе ущербен, т.к оперирует сущностями в себе, оторванными от реального их применения.
Если делать по уму, следовало сразу заводить отдельные пространства на каждый отдельный алфавит, если эти алфавиты отличаются хоть одной буквой или деталями семантики. А сейчас даже букву i в upper case не сконвертировать без знания языка, в котором она написана.  :3tfu:
Зато всякие č, š, ž, принадлежащие одному и тому же алфавиту, можно закодировать двумя разными последовательностями юникода, и не все программы понимают, что обе последовательности - это одна и та же буква.
:uzhos:
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Awwal12 от февраля 11, 2016, 08:07
Цитата: DarkMax2 от февраля  9, 2016, 17:52
Цитата: Тайльнемер от февраля  9, 2016, 08:41
Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Это уже проблема образования.
Если вам, например, нужно что-то надиктовать клиенту, то это ваша проблема, а не проблема образования...
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Тайльнемер от февраля 11, 2016, 08:23
Offtop
Цитата: wandrien от февраля 11, 2016, 05:25
Если делать по уму, следовало сразу заводить отдельные пространства на каждый отдельный алфавит, если эти алфавиты отличаются хоть одной буквой или деталями семантики.
Ну, эта крайность тоже имеет уйму своих недостатков. Я бы сказал, их даже больше чем в уникоде.

Возьмём, например, азербайджанскую латиницу.
Вика пишет, что с 1925 г. ввели один вариант яналифа, в 1933-м заменили на другой, отличающийся несколькими буквами, в 1938-м отменили букву ŋ, потом в 1992-м появилась новая латиница, и тут же она подверглась ещё одной правке — ä заменили на ə.
Что же, включать в кодировку все пять азербайджанских латиниц как совершенно разные алфавиты? А проекты?
А завтра, например, введут ещё одну букву, какую-нибудь á, которая уже давно есть в уникоде, и люди могли бы просто обновить раскладку, чтобы ей пользоваться. Но с вашим подходом им придётся перейти на другую облать кодировки и полностью другими код-поинтами для тех же букв. И большинство программ ничего не будет знать о соответствиях между ними (пока их не удосужатся обновить) и, например, чтобы найти слово тексте, нужно будет сперва понять, дореформенный он или нет, и в зависимости от этого поставить старую или новую раскладку, и набрать его в ней (даже если в этом слове нет злополучной буквы á). А сколько появится смешанных текстов, которые редактировали в разных алфавитах.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: wandrien от февраля 11, 2016, 08:37
Цитата: Тайльнемер от февраля 11, 2016, 08:23
Что же, включать в кодировку все пять азербайджанских латиниц как совершенно разные алфавиты? А проекты?
Дааа, это перебор.  :what:
Значит, как минимум, надо жестко прописывать семантику символам. Чтобы не было такого беспорядка как с буквой i. Если для латинской и турецкой i правила капитализации не совпадают, это должны быть разные буквы.  :???
Название: Вопрос живущим вне России про имена доменов на кирилли
Отправлено: Hellerick от февраля 11, 2016, 08:41
Нужно еще учитывать, для подавляющего большинства программистов возиться с системой иной, нежели «1 код = 1 символ» — неприемлемая дурь. Это нам интересно возиться с яналифами, а у вменяемых людей есть более насущные задачи, которые нельзя усложнять из-за символов, которые на практике использоваться не будут.
Название: Вопрос живущим вне России про имена доменов на кирилли
Отправлено: wandrien от февраля 11, 2016, 08:45
Цитата: Hellerick от февраля 11, 2016, 08:41
Нужно еще учитывать, для подавляющего большинства программистов возиться с системой иной, нежели «1 код = 1 символ» — неприемлемая дурь. Это нам интересно возиться с яналифами, а у вменяемых людей есть более насущные задачи, которые нельзя усложнять из-за символов, которые на практике использоваться не будут.
Программистов жизнь заставиляет помаленьку. Не поддерживать поток utf-8 хотя бы на уровне "чо написано не знаю, но буквы не порчу - уже хорошо" считается плохим тоном. Надо давить дальше.  8-)
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Hellerick от февраля 11, 2016, 08:57
Я вот чувствую, что задача эта должна решаться через какие-нибудь "частные расширения" Юникода.

Присвоить какой-нибудь юникодовской позиции значение подключения дополнительной карты символов, за которым должен идти URL этой карты. А в карте стандартным образом расписаны коды символов, их семантика, связи между ними (какие являются строчными и заглавными вариантами друг друга, какие получены диакритикой из других символов и т. п.)

И не надо будет клингонцам приставить к Консорциуму, чтобы включили в стандарт их закорючки — просто заведут для них собственную страничку.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 11, 2016, 11:28
Цитата: wandrien от февраля 11, 2016, 05:25Зато всякие č, š, ž, принадлежащие одному и тому же алфавиту, можно закодировать двумя разными последовательностями юникода, и не все программы понимают, что обе последовательности - это одна и та же буква.
Это о чём? О прекомбайнах vs. буква+комбайн? :???
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: wandrien от февраля 11, 2016, 11:31
Цитата: Bhudh от февраля 11, 2016, 11:28
Цитата: wandrien от февраля 11, 2016, 05:25Зато всякие č, š, ž, принадлежащие одному и тому же алфавиту, можно закодировать двумя разными последовательностями юникода, и не все программы понимают, что обе последовательности - это одна и та же буква.
Это о чём? О прекомбайнах vs. буква+комбайн? :???
Ага. Вот буквально на днях на memrise-е наткнулся на эти грабли.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 11, 2016, 11:42
Ну так последовательность и не есть буква. Чисто побайтно.
А семантику последовательностей надо уже отдельно запиливать, и для прог, не являющихся текстовыми редакторами/процессорами мало кто этим будет заниматься.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: wandrien от февраля 11, 2016, 11:48
Цитата: Bhudh от февраля 11, 2016, 11:42
А семантику последовательностей надо уже отдельно запиливать, и для прог, не являющихся текстовыми редакторами/процессорами мало кто этим будет заниматься.
Как бы то ни было, это много где надо и мало где делается.
Как оказалось, аж на целом портале, посвященном изучению языков, нет нормализации комбайнов.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Тайльнемер от февраля 11, 2016, 11:50
Цитата: wandrien от февраля 11, 2016, 08:37
Чтобы не было такого беспорядка как с буквой i. Если для латинской и турецкой i правила капитализации не совпадают, это должны быть разные буквы.
Это, конечно, безобразие.
Здесь, кажется, уникодовцы руководствовались принципами однозначности преобразования в уникод старых стандартных кодовых страниц. В турецкой кодировке когда-то не удосужились ввести отдельную букву, уникод это просто унаследовал для совместимости.

Кстати, это единственный случай, когда от языка зависит результат преобразования регистра? Вроде бы, в каком-то языке есть традиция не вешать диакритики на заглавные буквы. С капитализацией эсцета тоже как-то всё плохо.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 11, 2016, 11:50
Цитата: wandrien от февраля 11, 2016, 11:48Как оказалось, аж на целом портале, посвященном изучению языков, нет нормализации комбайнов.
www.unipad.org (http://www.unipad.org) Вам в помощь.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Тайльнемер от февраля 11, 2016, 11:58
Да, вот яналифная Bʙ тоже по-хорошему должна бы быть отдельной парой букв.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: wandrien от февраля 11, 2016, 12:11
Цитата: Bhudh от февраля 11, 2016, 11:50
Цитата: wandrien от февраля 11, 2016, 11:48Как оказалось, аж на целом портале, посвященном изучению языков, нет нормализации комбайнов.
www.unipad.org (http://www.unipad.org) Вам в помощь.
При чем тут unipad, если сайт у вас спрашивает, например, "Напишите слово печь по-сербски", и с вероятностью 50% ответ peć будет неправильным.
На самом деле конечно ситуация не столь плачевная, всего в паре уроков попадался этот баг, и кнопка Ignore спасает. Просто кто-то набрал несколько слов не прекомбайнами, а комбинациями c + модификатор. Но баг есть баг.

Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 11, 2016, 12:13
То есть у них там ответы вбиты с комбайнами? Это уже печально, источники им надо лучше выбирать.
А то так можно ж и из неуникодного пэдээфа скопипастить.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: DarkMax2 от февраля 11, 2016, 12:23
Цитата: Тайльнемер от февраля 10, 2016, 06:54
Цитата: Hellerick от февраля  9, 2016, 17:29
Другое дело, что ему следовало сопровождаться принятием упорядочивающих правил, но этот шанс был как обычно упущен.
Вы о чём? Правил чего?

Цитата: DarkMax2 от февраля  9, 2016, 17:52
Цитата: Тайльнемер от февраля  9, 2016, 08:41
Диктовать кому-то — опять сложности — «эс как доллар, вэ как галочка» и т. д.
Это уже проблема образования.
Не совсем. Ведь не угадаешь, настроен ли собеседник в данный момент на восприятие («русского извода») латинских названий или английских.
Если произнесение английского названия буквы R как «а», конфликтующее с латинским названием A, ещё можно с натягом назвать проблемой образования (согласно правилам практической транскрипции «р» в названии должно присутствовать), то буква «и» создаёт путаницу независимо от образования, если другие буквы при этом не выдают своей принадлежности («эф», «эл», «эм», «эн», «эс»).
Математические названия литер знаете?
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Тайльнемер от февраля 11, 2016, 13:04
Цитата: DarkMax2 от февраля 11, 2016, 12:23
Математические названия литер знаете?
А как же! А толку? Это же не единственный способ их называть.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: злой от февраля 11, 2016, 14:10
Цитата: wandrien от февраля 11, 2016, 11:48
Как оказалось, аж на целом портале, посвященном изучению языков, нет нормализации комбайнов

(https://c-a.d-cd.net/2066ccas-960.jpg)

Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: wandrien от февраля 11, 2016, 14:26
Цитата: злой от февраля 11, 2016, 14:10
Тогда уж
(http://orig00.deviantart.net/18ae/f/2008/300/b/5/combine_by_fisherstyl.jpg)
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Hellerick от февраля 11, 2016, 18:09
Цитата: Bhudh от февраля 11, 2016, 11:50
Цитата: wandrien от февраля 11, 2016, 11:48Как оказалось, аж на целом портале, посвященном изучению языков, нет нормализации комбайнов.
www.unipad.org (http://www.unipad.org) Вам в помощь.

$199

Нехило.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 11, 2016, 18:17
Цитата: Running UniPad in unregistered mode is free for anyone. Unregistered mode allows viewing of documents without limitiation. Editing is session limited. If you register you will be able to run UniPad in registered mode and this limit will be removed.
Мне незарегистрированной версии за глаза.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Hellerick от февраля 11, 2016, 18:29
Я, вроде бы, раньше им пользовался, и ограничение как-то само собой пропадало.
Название: Вопрос живущим вне России про имена доменов на кириллице
Отправлено: Bhudh от февраля 11, 2016, 18:39
У меня тоже куда-то пропала надпись [Unregistered] в шапке. Хотя в About написано «This copy is unregistered».