Author Topic: Какой язык удобнее для синтаксического анализа?  (Read 5279 times)

0 Members and 1 Guest are viewing this topic.

Offline Gleki Arxokuna

  • Posts: 418
Не кажется ли вам, что чем больше в языке падежей, тем он проще для разбора?
Понятно, что падеж - субъективное понятие.
Но если падежей много, то вероятность того, что предложение будет парситься неоднозначно, меньше.
Так, может быть, финский, венгерский, табасаранский?
Что более эффективно, научить людей системе, которая паразитирует на реальных языках, и несколько упрощает их, исключая некоторые детали фактических исторических языков; или же более эффективно иметь большое количество языков.

lojban.org/papri/Ложбан_и_самогоноварение

lojban.org/papri/Революционный_привет!/Советский

Offline unlight

  • Posts: 890
  • Gender: Male
Не кажется ли вам, что чем больше в языке падежей, тем он проще для разбора?
Какая в этом смысле разница между падежом и предлогом/послелогом? К тому же во многих случаях один и тот же падеж может выполнять очень разные семантические функции.
Ἡ ἀρχή καί ἡ μεσότης καί τό τέλος, τῶν χρόνῳ διαιρετῶν εἰσι γνωρίσματα.

Ні жовтизни не стане, ні блакиті,
Щоб приховать червону кров Донбасу.

Offline Gleki Arxokuna

  • Posts: 418
Не кажется ли вам, что чем больше в языке падежей, тем он проще для разбора?
Какая в этом смысле разница между падежом и предлогом/послелогом? К тому же во многих случаях один и тот же падеж может выполнять очень разные семантические функции.
Никакой разницы. Какие у вас предложения?
А чем больше падежей, тем меньше вероятность, что падеж полисемичен. Только лишь вероятность.
Что более эффективно, научить людей системе, которая паразитирует на реальных языках, и несколько упрощает их, исключая некоторые детали фактических исторических языков; или же более эффективно иметь большое количество языков.

lojban.org/papri/Ложбан_и_самогоноварение

lojban.org/papri/Революционный_привет!/Советский

Offline Bienna

  • Posts: 614
  • Gender: Male
  • Программист, переводчик, преподаватель
    • Rólam
Так, может быть, финский, венгерский, табасаранский?
Насчёт табасаранского не знаю, в финском падежей немного, в венгерском немало, но многие из них могут обозначать разные вещи, вследствие чего в некоторых (а их вполне немало можно найти) ситуациях может возникать двойственность значения, что решается лишь контекстом, а это, как я понимаю, не то, что нужно :)
Nu vei obține niciodată ceea ce îți dorești dacă nu-l iei.

Offline Gleki Arxokuna

  • Posts: 418
Так, может быть, финский, венгерский, табасаранский?
Насчёт табасаранского не знаю, в финском падежей немного, в венгерском немало, но многие из них могут обозначать разные вещи, вследствие чего в некоторых (а их вполне немало можно найти) ситуациях может возникать двойственность значения, что решается лишь контекстом, а это, как я понимаю, не то, что нужно :)
По сути для синтаксического анализа надо выявить предикаты и аргументы (имя существительное/местоимение/имя собственное) прежде всего, определить в каком падеже (или с каким предлогом) стоит тот или иной аргумент.

Дальше уже легче. Мы можем узнать по словарю, что для конкретного глагола значит тот или иной падеж.
Что более эффективно, научить людей системе, которая паразитирует на реальных языках, и несколько упрощает их, исключая некоторые детали фактических исторических языков; или же более эффективно иметь большое количество языков.

lojban.org/papri/Ложбан_и_самогоноварение

lojban.org/papri/Революционный_привет!/Советский

Offline Wolliger Mensch

  • Global Moderator
  • *
  • Posts: 53527
  • Gender: Male
  • Haariger Affe
    • Подушка
а вот сейчас им нравится конкретно вот этот банан на столе
Тогда было бы the banana, нет?

Ср. в русском: плодовым мушкам понравился один банан и плодовым мушкам понравился этот банан ~ нереферентное плодовые мушки любят бананы.
«Вот интересно, каких лингвистических жемчуг можно найти в море отодвинутых книг», Ян Гавлиш.
«Впредь прошу помнить, что придумал игру не для любых ассоциаций, а для семантически оправданных. Например, чтó это такое: „рулетке“ — „выпечке“?? Тем более, что сей ляпсус я сам совершил…», Марбол
«Ветхий Завет написан на иврите и частично на армейском», Vesle Anne
«МЛ(ять)КО … ПЛ(ять)NЪ», Тася
«Вот откроет этот спойлер, например, Марго, ничего не подозревая, а потом будут по всему форуму блюющие смайлики…», Авал

Offline Ильич

  • Posts: 8349
  • Gender: Male
а вот сейчас им нравится конкретно вот этот банан на столе
Тогда было бы the banana, нет?

Ср. в русском: плодовым мушкам понравился один банан и плодовым мушкам понравился этот банан ~ нереферентное плодовые мушки любят бананы.
Вот я и удивляюсь, почему какой-то один банан из кучи им понравился

Offline Bhudh

  • Posts: 56208
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
Может, к другим доступ закрыт.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Offline Bienna

  • Posts: 614
  • Gender: Male
  • Программист, переводчик, преподаватель
    • Rólam
Nu vei obține niciodată ceea ce îți dorești dacă nu-l iei.

Offline RNK

  • Posts: 321
  • Gender: Male
Может, кечуа или аймара? Оба крайне регулярны. Несколько миллионов носителей и там, и там. Аймара будто бы был даже отмечен, как оптимальный для машинного перевода.
ḲelHä weṭei ʕaḲun kähla / ḳaλai palhʌ-ḳʌ na wetä / śa da ʔa-ḳʌ ʔeja ʔälä / ja-ḳo pele ṭuba wete

Offline Bhudh

  • Posts: 56208
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Offline Gleki Arxokuna

  • Posts: 418
Может, кечуа или аймара? Оба крайне регулярны. Несколько миллионов носителей и там, и там. Аймара будто бы был даже отмечен, как оптимальный для машинного перевода.

Я вынужден принять этот ответ. Спасибо!

Кечуа.
Агглютинация там плоха тем, что там аффиксы, а не отдельные слова.
Однако, возможно, выделение аффиксов будет более-менее простым. Тогда можно уже определить роль аргументов в клаузах.

Аймара куда менее регулярен, его применимость для машинного перевода скорее смахивает на рекламу. Возможно, что именно упомянутые особенности и стали причиной такой рекламы.
Что более эффективно, научить людей системе, которая паразитирует на реальных языках, и несколько упрощает их, исключая некоторые детали фактических исторических языков; или же более эффективно иметь большое количество языков.

lojban.org/papri/Ложбан_и_самогоноварение

lojban.org/papri/Революционный_привет!/Советский

 

With Quick-Reply you can write a post when viewing a topic without loading a new page. You can still use bulletin board code and smileys as you would in a normal post.

Note: this post will not display until it's been approved by a moderator.
Name: Email:
Verification:
Type the letters shown in the picture
Listen to the letters / Request another image
Type the letters shown in the picture:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: