Какой язык удобнее для синтаксического анализа?

Автор Gleki Arxokuna, августа 12, 2014, 12:46

0 Пользователи и 1 гость просматривают эту тему.

Gleki Arxokuna

Не кажется ли вам, что чем больше в языке падежей, тем он проще для разбора?
Понятно, что падеж - субъективное понятие.
Но если падежей много, то вероятность того, что предложение будет парситься неоднозначно, меньше.
Так, может быть, финский, венгерский, табасаранский?
Что более эффективно, научить людей системе, которая паразитирует на реальных языках, и несколько упрощает их, исключая некоторые детали фактических исторических языков; или же более эффективно иметь большое количество языков.

lojban.org/papri/Ложбан_и_самогоноварение

lojban.org/papri/Революционный_привет!/Советский

unlight

Цитата: Gleki Arxokuna от августа 13, 2014, 08:24
Не кажется ли вам, что чем больше в языке падежей, тем он проще для разбора?
Какая в этом смысле разница между падежом и предлогом/послелогом? К тому же во многих случаях один и тот же падеж может выполнять очень разные семантические функции.
Ἡ ἀρχή καί ἡ μεσότης καί τό τέλος, τῶν χρόνῳ διαιρετῶν εἰσι γνωρίσματα.

Gleki Arxokuna

Цитата: unlight от августа 13, 2014, 08:32
Цитата: Gleki Arxokuna от августа 13, 2014, 08:24
Не кажется ли вам, что чем больше в языке падежей, тем он проще для разбора?
Какая в этом смысле разница между падежом и предлогом/послелогом? К тому же во многих случаях один и тот же падеж может выполнять очень разные семантические функции.
Никакой разницы. Какие у вас предложения?
А чем больше падежей, тем меньше вероятность, что падеж полисемичен. Только лишь вероятность.
Что более эффективно, научить людей системе, которая паразитирует на реальных языках, и несколько упрощает их, исключая некоторые детали фактических исторических языков; или же более эффективно иметь большое количество языков.

lojban.org/papri/Ложбан_и_самогоноварение

lojban.org/papri/Революционный_привет!/Советский

Gyesa

Цитата: Gleki Arxokuna от августа 13, 2014, 08:24
Так, может быть, финский, венгерский, табасаранский?
Насчёт табасаранского не знаю, в финском падежей немного, в венгерском немало, но многие из них могут обозначать разные вещи, вследствие чего в некоторых (а их вполне немало можно найти) ситуациях может возникать двойственность значения, что решается лишь контекстом, а это, как я понимаю, не то, что нужно :)
Nu vei obține niciodată ceea ce îți dorești dacă nu-l iei.

Gleki Arxokuna

Цитата: Bienna от августа 13, 2014, 11:21
Цитата: Gleki Arxokuna от августа 13, 2014, 08:24
Так, может быть, финский, венгерский, табасаранский?
Насчёт табасаранского не знаю, в финском падежей немного, в венгерском немало, но многие из них могут обозначать разные вещи, вследствие чего в некоторых (а их вполне немало можно найти) ситуациях может возникать двойственность значения, что решается лишь контекстом, а это, как я понимаю, не то, что нужно :)
По сути для синтаксического анализа надо выявить предикаты и аргументы (имя существительное/местоимение/имя собственное) прежде всего, определить в каком падеже (или с каким предлогом) стоит тот или иной аргумент.

Дальше уже легче. Мы можем узнать по словарю, что для конкретного глагола значит тот или иной падеж.
Что более эффективно, научить людей системе, которая паразитирует на реальных языках, и несколько упрощает их, исключая некоторые детали фактических исторических языков; или же более эффективно иметь большое количество языков.

lojban.org/papri/Ложбан_и_самогоноварение

lojban.org/papri/Революционный_привет!/Советский

Wolliger Mensch

Цитата: Тайльнемер от августа 13, 2014, 04:41
Цитата: Bhudh от августа 13, 2014, 02:26
а вот сейчас им нравится конкретно вот этот банан на столе
Тогда было бы the banana, нет?

Ср. в русском: плодовым мушкам понравился один банан и плодовым мушкам понравился этот банан ~ нереферентное плодовые мушки любят бананы.
«Вот интересно, каких лингвистических жемчуг можно найти в море отодвинутых книг», Ян Гавлиш.
«Впредь прошу помнить, что придумал игру не для любых ассоциаций, а для семантически оправданных. Например, чтó это такое: ,,рулетке" — ,,выпечке"?? Тем более, что сей ляпсус я сам совершил...», Марбол
«Ветхий Завет написан на иврите и частично на армейском», Vesle Anne
«МЛ(ять)КО ... ПЛ(ять)NЪ», Тася
«Вот откроет этот спойлер, например, Марго, ничего не подозревая, а потом будут по всему форуму блюющие смайлики...», Авал
«Томан приличный мужчина. Правда по патриархальным меркам слегка голодранец», Vesle Anne
«Возможен ли фонетический переход "ж" в "п с придыханием"», forest

Ильич

Цитата: Wolliger Mensch от августа 13, 2014, 15:18
Цитата: Тайльнемер от августа 13, 2014, 04:41
Цитата: Bhudh от августа 13, 2014, 02:26
а вот сейчас им нравится конкретно вот этот банан на столе
Тогда было бы the banana, нет?

Ср. в русском: плодовым мушкам понравился один банан и плодовым мушкам понравился этот банан ~ нереферентное плодовые мушки любят бананы.
Вот я и удивляюсь, почему какой-то один банан из кучи им понравился

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Gyesa

Nu vei obține niciodată ceea ce îți dorești dacă nu-l iei.

RNK

Может, кечуа или аймара? Оба крайне регулярны. Несколько миллионов носителей и там, и там. Аймара будто бы был даже отмечен, как оптимальный для машинного перевода.
ḲelHä weṭei ʕaḲun kähla / ḳaλai palhʌ-ḳʌ na wetä / śa da ʔa-ḳʌ ʔeja ʔälä / ja-ḳo pele ṭuba wete

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Gleki Arxokuna

Цитата: RNK от августа 14, 2014, 10:28
Может, кечуа или аймара? Оба крайне регулярны. Несколько миллионов носителей и там, и там. Аймара будто бы был даже отмечен, как оптимальный для машинного перевода.

Я вынужден принять этот ответ. Спасибо!

Кечуа.
Агглютинация там плоха тем, что там аффиксы, а не отдельные слова.
Однако, возможно, выделение аффиксов будет более-менее простым. Тогда можно уже определить роль аргументов в клаузах.

Аймара куда менее регулярен, его применимость для машинного перевода скорее смахивает на рекламу. Возможно, что именно упомянутые особенности и стали причиной такой рекламы.
Что более эффективно, научить людей системе, которая паразитирует на реальных языках, и несколько упрощает их, исключая некоторые детали фактических исторических языков; или же более эффективно иметь большое количество языков.

lojban.org/papri/Ложбан_и_самогоноварение

lojban.org/papri/Революционный_привет!/Советский

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр