Лингвофорум

Теоретический раздел => Прикладная лингвистика => Компьютерная лингвистика => Тема начата: Medrawd от мая 24, 2024, 18:40

Название: Есть где-то полный список слогов деванагари?
Отправлено: Medrawd от мая 24, 2024, 18:40
Подскажите, есть ли где-то такое? Хочу написать свой перекодировщик из IAST в деванагари и сиддхам. Или как это лучше всего сделать, если не тупо заменять все встреченные слоги конкретными символами и лигатурами?
Название: От: Есть где-то полный список слогов деванагари?
Отправлено: Andrey Lukyanov от мая 24, 2024, 20:16
А побуквенно перекодировать не получается?

Я так понимаю, что отдельная обработка требуется только для согласный+а и для согласного без последующего гласного. Ну ещё для ai и au.

Лигатуры же будут формироваться автоматически при выводе на экран или на печать.
Название: От: Есть где-то полный список слогов деванагари?
Отправлено: Bhudh от мая 24, 2024, 20:45
Цитата: Andrey Lukyanov от мая 24, 2024, 20:16А побуквенно перекодировать не получается?
Получается, конечно:
straṃ → स्त्रं
ṣṭra → ष्ट्र
skra → स्क्र

Цитата: Andrey Lukyanov от мая 24, 2024, 20:16Лигатуры же будут формироваться автоматически при выводе на экран или на печать.
Истинно так!
Никаких специально собранных "списков слогов" (я так понимаю, имеются в виду все возможные силлабемы?) для этого не требуется, в хорошем шрифте отлигатурятся даже такие сочетания графем, которых в принципе в языках, пользующихся деванагари, встретиться не может.
Например:
ḍṣka → ड्ष्क
pṭhī → प्ठी
pṭhhī → प्ठ्ही
kskṣaiḥ → क्स्क्षैः

Medrawd, зачем Вам собственный перекодировшик, если он уже есть, причём универсальный, берёт и ITRANS, и IAST.
А в интернете наверняка их ещё сотни.