Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Проект международного сайта транслита

Автор Vertaler, февраля 22, 2005, 18:12

0 Пользователи и 1 гость просматривают эту тему.

Vertaler

Эх не знаю я, куда лучше эту тему писать, ну да ладно.

Каждый русскоязычный пользователь Интернета сталкивался с русским транслитом — передачей русских слов средствами английского алфавита.
Мне пару раз приходилось вчитываться в болгарский транслит.

Кроме того, передача языка с латинской письменностью средствами только английского алфавита (проще говоря, письмо без диакритиков) встречается не реже. Вспомните румын, которые вообще зачастую не знают, что их буквы поддерживаются компьютерами, вспомните того турка в теме Türkçe, который поленился даже копировать буквы из других постов... и т. п.

В общем, я предлагаю совместными усилиями создать сайт, на котором будут помещены страницы с формами перекодировки для всех более-менее распространённых языков (по типу //translit.ru).

То есть по мере ввода с клавиатуры в форму текст превращается в нормальный.

Посетителям этого форума подобный сайт тоже может быть полезен, поскольку 1) не все могут установить клавиатуру Евгения, 2) существует великое множество алфавитов, не только латинических или кириллических, 3) мало ли откуда нам приходится писать.

Причём одним из преимуществ будущего проекта будет то, что все языки на нём будут вместе. Поскольку если что-то подобное сейчас и существует, то существует оно по отдельности: один сайт для русских, другой для евреев, третий для индусов и т. п.

Разместить его предлагается на каком-нибудь бесплатном хостинге, которых в сетке целая куча.

Я бы и сам сделал, но, к сожалению, Џава-скриптом не владею.



Для затравки предложу таблицу перекодировки для чешского и словацкого.

Полный список диакритиков в алфавитах этих языков такой:

Ä Á Č Ď Ě É Í Ľ Ĺ Ň Ô Ó Ř Ŕ Š Ť Ů Ú Ý Ž

(кажется, ничего не пропустил).

Заметим, что над каждой буквой бывает либо один, либо два диакритика, причём среди этих двух один — обязательно акут.
Поэтому апостроф после буквы превращает её в букву с акутом, ещё какая-нибудь фиговина после буквы  (например, ^) — в букву с другим знаком.



Жду вашей реакции.
Стрч прст в крк и вынь сухим.

Ян Ковач

Цитата: Vertaler van TekstenЗаметим, что над каждой буквой бывает либо один, либо два диакритика, причём среди этих двух один — обязательно акут.
Что значит два диакритика над одной буквой? :dunno:

Vertaler

Цитата: Ян КовачЧто значит два диакритика над одной буквой?
Ну вот в перечне акцентированных букв есть, например, два издевательства над Е: Ě и É. А над С — только одно: Č.
Стрч прст в крк и вынь сухим.

Ян Ковач

Ясно, я думал, что одновременно. :oops: :mrgreen:
Для большинства славянских языков, как частный случай,
необходимо, как минимум, завести передачу мягкости (ě) и долготы (é).

Vertaler

Цитата: Ян КовачЯсно, я думал, что одновременно.  
Для большинства славянских языков, как частный случай,
необходимо, как минимум, завести передачу мягкости (ě) и долготы (é).
Не знаю, к чему это относится.

А вы ведь вроде в компьютерной сфере работаете, да? Вы знаете Џаваскрипт?
Стрч прст в крк и вынь сухим.

Ян Ковач

Цитата: Vertaler van TekstenА вы ведь вроде в компьютерной сфере работаете, да? Вы знаете Џаваскрипт?
Комп. языки не знаю очень хорошо, джаваскрипт отнюдь, жаль...:(

Vertaler

Цитата: Ян КовачКомп. языки не знаю очень хорошо, джаваскрипт отнюдь, жаль...
А идею мою поддерживаете?
Стрч прст в крк и вынь сухим.

Ян Ковач

Конечно, да, это удобнее, чем искать в Хармапе знаки,
толи старослава, толи арабского, или других.
Даже переключение на наинсталированную разкладку
сначала много не даёт, надо изучить наизусть, где какие буквы.
(Знаю лишь про русский)
Предполагаю, что самое удобное использовать график клавиатуры,
потом просто скопировать текст сюда и вставить универсальный шрифт,
это в таком смысле предлагаете?
Такое было бы совсем полезно.  :yes:
-----------------
У меня сильно ограничена уже возможность войти в систему,
азбука не везде...(я мог и латински зарегистроваться  :skler: )

iskender

Мысль замечательная.
Только вот сам я вряд ли смогу чем-либо помочь. :(

Vertaler

Цитата: iskenderМысль замечательная.
Только вот сам я вряд ли смогу чем-либо помочь.
А таблицы составлять? :)
Вот что я ещё вчера специально для вас придумал:

Турецкий, татарский, азербайджанский, крымский.

A' —> Ä, A^ —> Â, C' —> Ç, E^—> Ə, E' —> É, G' —> Ğ, I' —> Í, I^i^ —> İı, N' —> Ñ, O' —> Ö, S' —> Ş, U' —> Ü.
Стрч прст в крк и вынь сухим.

iskender

Цитата: Vertaler van TekstenА таблицы составлять? :)
Это как?
Цитата: Vertaler van TekstenВот что я ещё вчера специально для вас придумал:

Турецкий, татарский, азербайджанский, крымский.
A' —> Ä, A^ —> Â, C' —> Ç, E^—> Ə, E' —> É, G' —> Ğ, I' —> Í, I^i^ —> İı, N' —> Ñ, O' —> Ö, S' —> Ş, U' —> Ü.
Ещё есть туркмены. Там придумали такую бяку как Ň ň, и ещё у них есть буковка Ý ý.
И уйгуры с их изобретением É é.

Vertaler

Цитата: iskenderЕщё есть туркмены. Там придумали такую бяку как Ň ň, и ещё у них есть буковка Ý ý.
И уйгуры с их изобретением É é.
Уйгуров уже учли, для туркменов остались N^ и Y'. Надеюсь, казахов приплетать не будем? :D
Стрч прст в крк и вынь сухим.

iskender

Цитата: Vertaler van TekstenУйгуров уже учли...
Точно, я не заметил. Прошу прощения.
Цитата: Vertaler van TekstenНадеюсь, казахов приплетать не будем? :D
Ага. Пущай вначале они сами разберутся.:mrgreen:

Да, и ещё по поводу туркмен... Там было несколько редакций латиницы, что-то подправляли уже после того, как начали вводить, поэтому надо уточнить там сейчас j = ж, с = дж или  ž = ж, j = дж. Я вот не уверен.:? На омниглоте висит второй вариант, но уж больно он странен, поэтому меня грызут сомнения. Надо будет порыться в сети...

Vertaler

Все языки, буквы для которых есть в кодировке WE, можно объединить, передрав всё с раскладки «английская международная», то есть

A + ' = Á
A + ` = À
A + ~ = Ã
A + " =Ä
O + / = Ø

Плюс чё-то ещё придумать для å, æ, œ, š, þ, ð, ¡, ¿.
Стрч прст в крк и вынь сухим.

iskender

Цитата: iskenderДа, и ещё по поводу туркмен... Там было несколько редакций латиницы, что-то подправляли уже после того, как начали вводить, поэтому надо уточнить там сейчас j = ж, с = дж или  ž = ж, j = дж. Я вот не уверен.:? На омниглоте висит второй вариант, но уж больно он странен, поэтому меня грызут сомнения. Надо будет порыться в сети...
Мои опасения подтвердились. Сейчас используется именно второй вариант. Вот, полюбуйтесь http://www.turkmenstudents.com/Tu/alpbi.htm. Я никого не хочу обидеть, но ИМХО иначе, чем извращением, такой алфавит назвать нельзя. Так что, видимо, для туркмен будет ещё Z^ = Ž.

Цитата: Vertaler van TekstenВсе языки, буквы для которых есть в кодировке WE, можно объединить, передрав всё с раскладки «английская международная», то есть

A + ' = Á
A + ` = À
A + ~ = Ã
A + " =Ä
O + / = Ø

Плюс чё-то ещё придумать для å, æ, œ, š, þ, ð, ¡, ¿.
Ну да. И самое главное, это интуитивно понятно.
Вот из таких же соображений может имеет смысл сделать S, = Ş и C, = Ç?

Vertaler

Цитата: iskenderВот из таких же соображений может имеет смысл сделать S, = Ş и C, = Ç?
Yes, sir! —> Yeş sir. :no:
Стрч прст в крк и вынь сухим.

iskender

Цитата: Vertaler van Teksten
Цитата: iskenderВот из таких же соображений может имеет смысл сделать S, = Ş и C, = Ç?
Yes, sir! —> Yeş sir. :no:
М-да...:? Об этом я не подумал. Хотя, строго говоря, например с r' = ŕ тоже могут возникнуть фокусы типа brother's = brotheŕs.:_1_17

Vertaler

Апостроф встречается гораздо реже, чем запятая, и для таких случаев надо просто выключать перекодировщик.
Стрч прст в крк и вынь сухим.

iskender

Цитата: Vertaler van TekstenАпостроф встречается гораздо реже, чем запятая, и для таких случаев надо просто выключать перекодировщик.
Логично.

AlefZet

Цитата: iskender
Цитата: iskenderДа, и ещё по поводу туркмен... Там было несколько редакций латиницы, что-то подправляли уже после того, как начали вводить, поэтому надо уточнить там сейчас j = ж, с = дж или  ž = ж, j = дж. Я вот не уверен.:? На омниглоте висит второй вариант, но уж больно он странен, поэтому меня грызут сомнения. Надо будет порыться в сети...
Мои опасения подтвердились. Сейчас используется именно второй вариант. Вот, полюбуйтесь http://www.turkmenstudents.com/Tu/alpbi.htm. Я никого не хочу обидеть, но ИМХО иначе, чем извращением, такой алфавит назвать нельзя. Так что, видимо, для туркмен будет ещё Z^ = Ž.
Поправьте ссылку, не открывается. Там, что алфавит такой как на Türkmen diliniň täze elipbiýi

Ah tlamiz noxochiuh ah tlaniz nocuic
In noconehua
Xexelihui ya moyahua

iskender

Цитата: AlefZetПоправьте ссылку, не открывается. Там, что алфавит такой как на Türkmen diliniň täze elipbiýi
Да, такой же. С той ссылкой чо-то случилось. Когда я её тут писал, всё работало. Вот - откопал тоже самое на другом сайте http://www.altynasyr.8m.com/portal/alphabet.htm

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр