Лингвофорум

Теоретический раздел => Прикладная лингвистика => Вопросы письменности => Тема начата: Vertaler от февраля 22, 2005, 18:12

Название: Проект международного сайта транслита
Отправлено: Vertaler от февраля 22, 2005, 18:12
Эх не знаю я, куда лучше эту тему писать, ну да ладно.

Каждый русскоязычный пользователь Интернета сталкивался с русским транслитом — передачей русских слов средствами английского алфавита.
Мне пару раз приходилось вчитываться в болгарский транслит.

Кроме того, передача языка с латинской письменностью средствами только английского алфавита (проще говоря, письмо без диакритиков) встречается не реже. Вспомните румын, которые вообще зачастую не знают, что их буквы поддерживаются компьютерами, вспомните того турка в теме Türkçe, который поленился даже копировать буквы из других постов... и т. п.

В общем, я предлагаю совместными усилиями создать сайт, на котором будут помещены страницы с формами перекодировки для всех более-менее распространённых языков (по типу translit.ru).

То есть по мере ввода с клавиатуры в форму текст превращается в нормальный.

Посетителям этого форума подобный сайт тоже может быть полезен, поскольку 1) не все могут установить клавиатуру Евгения, 2) существует великое множество алфавитов, не только латинических или кириллических, 3) мало ли откуда нам приходится писать.

Причём одним из преимуществ будущего проекта будет то, что все языки на нём будут вместе. Поскольку если что-то подобное сейчас и существует, то существует оно по отдельности: один сайт для русских, другой для евреев, третий для индусов и т. п.

Разместить его предлагается на каком-нибудь бесплатном хостинге, которых в сетке целая куча.

Я бы и сам сделал, но, к сожалению, Џава-скриптом не владею.



Для затравки предложу таблицу перекодировки для чешского и словацкого.

Полный список диакритиков в алфавитах этих языков такой:

Ä Á Č Ď Ě É Í Ľ Ĺ Ň Ô Ó Ř Ŕ Š Ť Ů Ú Ý Ž

(кажется, ничего не пропустил).

Заметим, что над каждой буквой бывает либо один, либо два диакритика, причём среди этих двух один — обязательно акут.
Поэтому апостроф после буквы превращает её в букву с акутом, ещё какая-нибудь фиговина после буквы  (например, ^) — в букву с другим знаком.



Жду вашей реакции.
Название: Проект международного сайта транслита
Отправлено: Ян Ковач от февраля 22, 2005, 19:50
Цитата: Vertaler van TekstenЗаметим, что над каждой буквой бывает либо один, либо два диакритика, причём среди этих двух один — обязательно акут.
Что значит два диакритика над одной буквой? :dunno:
Название: Проект международного сайта транслита
Отправлено: Vertaler от февраля 22, 2005, 19:59
Цитата: Ян КовачЧто значит два диакритика над одной буквой?
Ну вот в перечне акцентированных букв есть, например, два издевательства над Е: Ě и É. А над С — только одно: Č.
Название: Проект международного сайта транслита
Отправлено: Ян Ковач от февраля 22, 2005, 20:13
Ясно, я думал, что одновременно. :oops: :mrgreen:
Для большинства славянских языков, как частный случай,
необходимо, как минимум, завести передачу мягкости (ě) и долготы (é).
Название: Проект международного сайта транслита
Отправлено: Vertaler от февраля 22, 2005, 20:17
Цитата: Ян КовачЯсно, я думал, что одновременно.  
Для большинства славянских языков, как частный случай,
необходимо, как минимум, завести передачу мягкости (ě) и долготы (é).
Не знаю, к чему это относится.

А вы ведь вроде в компьютерной сфере работаете, да? Вы знаете Џаваскрипт?
Название: Проект международного сайта транслита
Отправлено: Ян Ковач от февраля 22, 2005, 20:25
Цитата: Vertaler van TekstenА вы ведь вроде в компьютерной сфере работаете, да? Вы знаете Џаваскрипт?
Комп. языки не знаю очень хорошо, джаваскрипт отнюдь, жаль...:(
Название: Проект международного сайта транслита
Отправлено: Vertaler от февраля 22, 2005, 20:32
Цитата: Ян КовачКомп. языки не знаю очень хорошо, джаваскрипт отнюдь, жаль...
А идею мою поддерживаете?
Название: Проект международного сайта транслита
Отправлено: Ян Ковач от февраля 22, 2005, 20:49
Конечно, да, это удобнее, чем искать в Хармапе знаки,
толи старослава, толи арабского, или других.
Даже переключение на наинсталированную разкладку
сначала много не даёт, надо изучить наизусть, где какие буквы.
(Знаю лишь про русский)
Предполагаю, что самое удобное использовать график клавиатуры,
потом просто скопировать текст сюда и вставить универсальный шрифт,
это в таком смысле предлагаете?
Такое было бы совсем полезно.  :yes:
-----------------
У меня сильно ограничена уже возможность войти в систему,
азбука не везде...(я мог и латински зарегистроваться  :skler: )
Название: Проект международного сайта транслита
Отправлено: iskender от февраля 22, 2005, 22:05
Мысль замечательная.
Только вот сам я вряд ли смогу чем-либо помочь. :(
Название: Проект международного сайта транслита
Отправлено: Vertaler от февраля 22, 2005, 22:07
Цитата: iskenderМысль замечательная.
Только вот сам я вряд ли смогу чем-либо помочь.
А таблицы составлять? :)
Вот что я ещё вчера специально для вас придумал:

Турецкий, татарский, азербайджанский, крымский.

A' —> Ä, A^ —> Â, C' —> Ç, E^—> Ə, E' —> É, G' —> Ğ, I' —> Í, I^i^ —> İı, N' —> Ñ, O' —> Ö, S' —> Ş, U' —> Ü.
Название: Проект международного сайта транслита
Отправлено: iskender от февраля 22, 2005, 22:21
Цитата: Vertaler van TekstenА таблицы составлять? :)
Это как?
Цитата: Vertaler van TekstenВот что я ещё вчера специально для вас придумал:

Турецкий, татарский, азербайджанский, крымский.
A' —> Ä, A^ —> Â, C' —> Ç, E^—> Ə, E' —> É, G' —> Ğ, I' —> Í, I^i^ —> İı, N' —> Ñ, O' —> Ö, S' —> Ş, U' —> Ü.
Ещё есть туркмены. Там придумали такую бяку как Ň ň, и ещё у них есть буковка Ý ý.
И уйгуры с их изобретением É é.
Название: Проект международного сайта транслита
Отправлено: Vertaler от февраля 22, 2005, 22:26
Цитата: iskenderЕщё есть туркмены. Там придумали такую бяку как Ň ň, и ещё у них есть буковка Ý ý.
И уйгуры с их изобретением É é.
Уйгуров уже учли, для туркменов остались N^ и Y'. Надеюсь, казахов приплетать не будем? :D
Название: Проект международного сайта транслита
Отправлено: iskender от февраля 22, 2005, 22:41
Цитата: Vertaler van TekstenУйгуров уже учли...
Точно, я не заметил. Прошу прощения.
Цитата: Vertaler van TekstenНадеюсь, казахов приплетать не будем? :D
Ага. Пущай вначале они сами разберутся.:mrgreen:

Да, и ещё по поводу туркмен... Там было несколько редакций латиницы, что-то подправляли уже после того, как начали вводить, поэтому надо уточнить там сейчас j = ж, с = дж или  ž = ж, j = дж. Я вот не уверен.:? На омниглоте висит второй вариант, но уж больно он странен, поэтому меня грызут сомнения. Надо будет порыться в сети...
Название: Проект международного сайта транслита
Отправлено: Vertaler от февраля 22, 2005, 22:54
Все языки, буквы для которых есть в кодировке WE, можно объединить, передрав всё с раскладки «английская международная», то есть

A + ' = Á
A + ` = À
A + ~ = Ã
A + " =Ä
O + / = Ø

Плюс чё-то ещё придумать для å, æ, œ, š, þ, ð, ¡, ¿.
Название: Проект международного сайта транслита
Отправлено: iskender от февраля 22, 2005, 23:01
Цитата: iskenderДа, и ещё по поводу туркмен... Там было несколько редакций латиницы, что-то подправляли уже после того, как начали вводить, поэтому надо уточнить там сейчас j = ж, с = дж или  ž = ж, j = дж. Я вот не уверен.:? На омниглоте висит второй вариант, но уж больно он странен, поэтому меня грызут сомнения. Надо будет порыться в сети...
Мои опасения подтвердились. Сейчас используется именно второй вариант. Вот, полюбуйтесь http://www.turkmenstudents.com/Tu/alpbi.htm. Я никого не хочу обидеть, но ИМХО иначе, чем извращением, такой алфавит назвать нельзя. Так что, видимо, для туркмен будет ещё Z^ = Ž.

Цитата: Vertaler van TekstenВсе языки, буквы для которых есть в кодировке WE, можно объединить, передрав всё с раскладки «английская международная», то есть

A + ' = Á
A + ` = À
A + ~ = Ã
A + " =Ä
O + / = Ø

Плюс чё-то ещё придумать для å, æ, œ, š, þ, ð, ¡, ¿.
Ну да. И самое главное, это интуитивно понятно.
Вот из таких же соображений может имеет смысл сделать S, = Ş и C, = Ç?
Название: Проект международного сайта транслита
Отправлено: Vertaler от февраля 22, 2005, 23:18
Цитата: iskenderВот из таких же соображений может имеет смысл сделать S, = Ş и C, = Ç?
Yes, sir! —> Yeş sir. :no:
Название: Проект международного сайта транслита
Отправлено: iskender от февраля 22, 2005, 23:24
Цитата: Vertaler van Teksten
Цитата: iskenderВот из таких же соображений может имеет смысл сделать S, = Ş и C, = Ç?
Yes, sir! —> Yeş sir. :no:
М-да...:? Об этом я не подумал. Хотя, строго говоря, например с r' = ŕ тоже могут возникнуть фокусы типа brother's = brotheŕs.:_1_17
Название: Проект международного сайта транслита
Отправлено: Vertaler от февраля 22, 2005, 23:32
Апостроф встречается гораздо реже, чем запятая, и для таких случаев надо просто выключать перекодировщик.
Название: Проект международного сайта транслита
Отправлено: iskender от февраля 22, 2005, 23:34
Цитата: Vertaler van TekstenАпостроф встречается гораздо реже, чем запятая, и для таких случаев надо просто выключать перекодировщик.
Логично.
Название: Проект международного сайта транслита
Отправлено: AlefZet от апреля 3, 2005, 18:49
Цитата: iskender
Цитата: iskenderДа, и ещё по поводу туркмен... Там было несколько редакций латиницы, что-то подправляли уже после того, как начали вводить, поэтому надо уточнить там сейчас j = ж, с = дж или  ž = ж, j = дж. Я вот не уверен.:? На омниглоте висит второй вариант, но уж больно он странен, поэтому меня грызут сомнения. Надо будет порыться в сети...
Мои опасения подтвердились. Сейчас используется именно второй вариант. Вот, полюбуйтесь http://www.turkmenstudents.com/Tu/alpbi.htm. Я никого не хочу обидеть, но ИМХО иначе, чем извращением, такой алфавит назвать нельзя. Так что, видимо, для туркмен будет ещё Z^ = Ž.
Поправьте ссылку, не открывается. Там, что алфавит такой как на Türkmen diliniň täze elipbiýi
Название: Проект международного сайта транслита
Отправлено: iskender от апреля 3, 2005, 23:17
Цитата: AlefZetПоправьте ссылку, не открывается. Там, что алфавит такой как на Türkmen diliniň täze elipbiýi
Да, такой же. С той ссылкой чо-то случилось. Когда я её тут писал, всё работало. Вот - откопал тоже самое на другом сайте http://www.altynasyr.8m.com/portal/alphabet.htm