Эх не знаю я, куда лучше эту тему писать, ну да ладно.
Каждый русскоязычный пользователь Интернета сталкивался с русским транслитом — передачей русских слов средствами английского алфавита.
Мне пару раз приходилось вчитываться в болгарский транслит.
Кроме того, передача языка с латинской письменностью средствами только английского алфавита (проще говоря, письмо без диакритиков) встречается не реже. Вспомните румын, которые вообще зачастую не знают, что их буквы поддерживаются компьютерами, вспомните того турка в теме Türkçe, который поленился даже копировать буквы из других постов... и т. п.
В общем, я предлагаю совместными усилиями создать сайт, на котором будут помещены страницы с формами перекодировки для всех более-менее распространённых языков (по типу translit.ru).
То есть по мере ввода с клавиатуры в форму текст превращается в нормальный.
Посетителям этого форума подобный сайт тоже может быть полезен, поскольку 1) не все могут установить клавиатуру Евгения, 2) существует великое множество алфавитов, не только латинических или кириллических, 3) мало ли откуда нам приходится писать.
Причём одним из преимуществ будущего проекта будет то, что все языки на нём будут вместе. Поскольку если что-то подобное сейчас и существует, то существует оно по отдельности: один сайт для русских, другой для евреев, третий для индусов и т. п.
Разместить его предлагается на каком-нибудь бесплатном хостинге, которых в сетке целая куча.
Я бы и сам сделал, но, к сожалению, Џава-скриптом не владею.
Для затравки предложу таблицу перекодировки для чешского и словацкого.
Полный список диакритиков в алфавитах этих языков такой:
Ä Á Č Ď Ě É Í Ľ Ĺ Ň Ô Ó Ř Ŕ Š Ť Ů Ú Ý Ž
(кажется, ничего не пропустил).
Заметим, что над каждой буквой бывает либо один, либо два диакритика, причём среди этих двух один — обязательно акут.
Поэтому апостроф после буквы превращает её в букву с акутом, ещё какая-нибудь фиговина после буквы (например, ^) — в букву с другим знаком.
Жду вашей реакции.
Цитата: Vertaler van TekstenЗаметим, что над каждой буквой бывает либо один, либо два диакритика, причём среди этих двух один — обязательно акут.
Что значит
два диакритика над
одной буквой? :dunno:
Цитата: Ян КовачЧто значит два диакритика над одной буквой?
Ну вот в перечне акцентированных букв есть, например, два издевательства над Е: Ě и É. А над С — только одно: Č.
Ясно, я думал, что одновременно. :oops: :mrgreen:
Для большинства славянских языков, как частный случай,
необходимо, как минимум, завести передачу мягкости (ě) и долготы (é).
Цитата: Ян КовачЯсно, я думал, что одновременно.
Для большинства славянских языков, как частный случай,
необходимо, как минимум, завести передачу мягкости (ě) и долготы (é).
Не знаю, к чему это относится.
А вы ведь вроде в компьютерной сфере работаете, да? Вы знаете Џаваскрипт?
Цитата: Vertaler van TekstenА вы ведь вроде в компьютерной сфере работаете, да? Вы знаете Џаваскрипт?
Комп. языки не знаю очень хорошо, джаваскрипт отнюдь, жаль...:(
Цитата: Ян КовачКомп. языки не знаю очень хорошо, джаваскрипт отнюдь, жаль...
А идею мою поддерживаете?
Конечно, да, это удобнее, чем искать в Хармапе знаки,
толи старослава, толи арабского, или других.
Даже переключение на наинсталированную разкладку
сначала много не даёт, надо изучить наизусть, где какие буквы.
(Знаю лишь про русский)
Предполагаю, что самое удобное использовать график клавиатуры,
потом просто скопировать текст сюда и вставить универсальный шрифт,
это в таком смысле предлагаете?
Такое было бы совсем полезно. :yes:
-----------------
У меня сильно ограничена уже возможность войти в систему,
азбука не везде...(я мог и латински зарегистроваться :skler: )
Мысль замечательная.
Только вот сам я вряд ли смогу чем-либо помочь. :(
Цитата: iskenderМысль замечательная.
Только вот сам я вряд ли смогу чем-либо помочь.
А таблицы составлять? :)
Вот что я ещё вчера специально для вас придумал:
Турецкий, татарский, азербайджанский, крымский.
A' —> Ä, A^ —> Â, C' —> Ç, E^—> Ə, E' —> É, G' —> Ğ, I' —> Í, I^i^ —> İı, N' —> Ñ, O' —> Ö, S' —> Ş, U' —> Ü.
Цитата: Vertaler van TekstenА таблицы составлять? :)
Это как?
Цитата: Vertaler van TekstenВот что я ещё вчера специально для вас придумал:
Турецкий, татарский, азербайджанский, крымский.
A' —> Ä, A^ —> Â, C' —> Ç, E^—> Ə, E' —> É, G' —> Ğ, I' —> Í, I^i^ —> İı, N' —> Ñ, O' —> Ö, S' —> Ş, U' —> Ü.
Ещё есть туркмены. Там придумали такую бяку как
Ň ň, и ещё у них есть буковка
Ý ý.
И уйгуры с их изобретением
É é.
Цитата: iskenderЕщё есть туркмены. Там придумали такую бяку как Ň ň, и ещё у них есть буковка Ý ý.
И уйгуры с их изобретением É é.
Уйгуров уже учли, для туркменов остались N^ и Y'. Надеюсь, казахов приплетать не будем? :D
Цитата: Vertaler van TekstenУйгуров уже учли...
Точно, я не заметил. Прошу прощения.
Цитата: Vertaler van TekstenНадеюсь, казахов приплетать не будем? :D
Ага. Пущай вначале они сами разберутся.:mrgreen:
Да, и ещё по поводу туркмен... Там было несколько редакций латиницы, что-то подправляли уже после того, как начали вводить, поэтому надо уточнить там сейчас
j =
ж,
с =
дж или
ž =
ж,
j =
дж. Я вот не уверен.:? На омниглоте висит второй вариант, но уж больно он странен, поэтому меня грызут сомнения. Надо будет порыться в сети...
Все языки, буквы для которых есть в кодировке WE, можно объединить, передрав всё с раскладки «английская международная», то есть
A + ' = Á
A + ` = À
A + ~ = Ã
A + " =Ä
O + / = Ø
Плюс чё-то ещё придумать для å, æ, œ, š, þ, ð, ¡, ¿.
Цитата: iskenderДа, и ещё по поводу туркмен... Там было несколько редакций латиницы, что-то подправляли уже после того, как начали вводить, поэтому надо уточнить там сейчас j = ж, с = дж или ž = ж, j = дж. Я вот не уверен.:? На омниглоте висит второй вариант, но уж больно он странен, поэтому меня грызут сомнения. Надо будет порыться в сети...
Мои опасения подтвердились. Сейчас используется именно второй вариант. Вот, полюбуйтесь
http://www.turkmenstudents.com/Tu/alpbi.htm. Я никого не хочу обидеть, но ИМХО иначе, чем извращением, такой алфавит назвать нельзя. Так что, видимо, для туркмен будет ещё Z^ = Ž.
Цитата: Vertaler van TekstenВсе языки, буквы для которых есть в кодировке WE, можно объединить, передрав всё с раскладки «английская международная», то есть
A + ' = Á
A + ` = À
A + ~ = Ã
A + " =Ä
O + / = Ø
Плюс чё-то ещё придумать для å, æ, œ, š, þ, ð, ¡, ¿.
Ну да. И самое главное, это интуитивно понятно.
Вот из таких же соображений может имеет смысл сделать S, = Ş и C, = Ç?
Цитата: iskenderВот из таких же соображений может имеет смысл сделать S, = Ş и C, = Ç?
Yes, sir! —> Yeş sir. :no:
Цитата: Vertaler van TekstenЦитата: iskenderВот из таких же соображений может имеет смысл сделать S, = Ş и C, = Ç?
Yes, sir! —> Yeş sir. :no:
М-да...:? Об этом я не подумал. Хотя, строго говоря, например с r' = ŕ тоже могут возникнуть фокусы типа brother's = brotheŕs.:_1_17
Апостроф встречается гораздо реже, чем запятая, и для таких случаев надо просто выключать перекодировщик.
Цитата: Vertaler van TekstenАпостроф встречается гораздо реже, чем запятая, и для таких случаев надо просто выключать перекодировщик.
Логично.
Цитата: iskenderЦитата: iskenderДа, и ещё по поводу туркмен... Там было несколько редакций латиницы, что-то подправляли уже после того, как начали вводить, поэтому надо уточнить там сейчас j = ж, с = дж или ž = ж, j = дж. Я вот не уверен.:? На омниглоте висит второй вариант, но уж больно он странен, поэтому меня грызут сомнения. Надо будет порыться в сети...
Мои опасения подтвердились. Сейчас используется именно второй вариант. Вот, полюбуйтесь http://www.turkmenstudents.com/Tu/alpbi.htm. Я никого не хочу обидеть, но ИМХО иначе, чем извращением, такой алфавит назвать нельзя. Так что, видимо, для туркмен будет ещё Z^ = Ž.
Поправьте ссылку, не открывается. Там, что алфавит такой как на
Türkmen diliniň täze elipbiýi
Цитата: AlefZetПоправьте ссылку, не открывается. Там, что алфавит такой как на Türkmen diliniň täze elipbiýi
Да, такой же. С той ссылкой чо-то случилось. Когда я её тут писал, всё работало. Вот - откопал тоже самое на другом сайте
http://www.altynasyr.8m.com/portal/alphabet.htm