Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Давайте. Переводчик. Моно.

Автор Алексей Гринь, мая 7, 2010, 19:03

0 Пользователи и 2 гостей просматривают эту тему.

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

arseniiv

О. ;D Но всё равно SMW с переводчиками разве так сильно пересекается? Не лучше для переводчика придумать отдельный формат?

Bhudh

Так если семантические шшупальца уже готовы, можно и воспользоваться.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо


Demetrius

Как-то упустил эту тему...

Цитата: Алексей Гринь от мая 28, 2010, 00:28
Цитата: Demetrius от мая 27, 2010, 18:52
Только вот что-то у меня подозрение, что структура будет недостаточно гибкой. Падежи заранее забиты в существительное, а какие-нибудь другие классы — нет.
М-м-м. Гибкость тут ни при чём. То, что вы предлагаете - это синтаксический сахар. Т.е. как бы с ним приятнее, но обойтись можно легко. «сундук(я-поссессив)» это абсолютно то же самое.
Ну как бы падежи тоже тогда можно почти все выкинуть.

Зачем «дом»-инессив, если можно «внутренняя часть» («дом»-притяжательность)?
Зачем «я-номинатив жить-настоящее время Минск-инессив», если можно «я-субъект (населяя Минск-объект) сейчас жить»?

Почему падежи — это базовая абстракция, а притяжательность — это мишура?

Цитата: arseniiv от мая 29, 2010, 19:02
Я думаю, надо отказаться от фиксированных грамматических категорий. Иначе с таким подходом могут быть для некоторых пар языков очень корявые переводы из-за того, что внутренние представления фраз на них будут слишком разными. Надо сделать всё-таки что-то типа синтаксического дерева. Тогда при определённых усилиях со стороны модулей можно даже будет получать "художественный" перевод. Можно обойтись без дерева, помечая слова маркерами, которые могут иметь разное количество параметров, притом маркеров должно быть разных много. То есть, как тут маркеры, но без деления их на падежи и т. п..
Согласен. ИМХО нужны квантитативные методы.

Алексей Гринь

Я подумал, лучше на первый раз тупо захардкодить англ.-рус.

Предложенные в сабже масштабы не осилить без должной практики и времени.
肏! Τίς πέπορδε;

Алексей Гринь

Цитата: Demetrius от августа 16, 2010, 17:46
Почему падежи — это базовая абстракция, а притяжательность — это мишура?
Падежи здесь используются в несколько другом свете. Падеж здесь некий абстрактный маркер, связывающий слова меж собой. Какие маркеры берутся, а какие нет — дело удобства и пользы (для перевода), а не стройности и научного расчёта.

Цитата: Demetrius от августа 16, 2010, 17:46
Зачем «дом»-инессив, если можно «внутренняя часть» («дом»-притяжательность)?
Маркеры берутся, чтобы было удобнее и полезнее, а не чтобы было логично и красиво.

Как бы всё это условности, а не самостоятельные факты.
肏! Τίς πέπορδε;

Demetrius

Тогда понятно.

Кстати, для использования Semantic MediaWiki немножко мешает то, что все слова с большой буквы.

Bhudh

Кто мешает чуточку подправить код?
Чтоб было как в Викисловаре.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Karakurt

Как жалко что до сих пор не создали переводчик. 21-й век на дворе. :)

Алексей Гринь

В общем, заявленные масштабы требуют много ресёрча. Будем делать конкретно rus-eng.
Первым шагом сделал простенький "деклинатор" для русского языка (делал ещё полгода назад как-то, may include bydlocode, ибо прототип).

Аттачу к сообщению. Поиграйтесь, что ли...

Внутри деклинатор сущ., прилагательные вроде тоже сделаны (не помню), глаголов нетути...
Требует дотнет; если сильно надо, могу скинуть стандалоне-версию, только весить будет под 1-2 мб.

Скриншот:


肏! Τίς πέπορδε;

Demetrius

Наконец-то собрался с духом, поставил себе дотнет и попробовал. Вроде бы всё работает без особых проблем.

Заметил только, что у "куча", "круча" неправильный Gen. pl.

Ещё потом поиграюсь.

Alone Coder

Сначала сделайте годный переводчик с французского на интерлингву. Если и при такой упрощённой задаче ничего не получится, то чего говорить о падежах, стилях речи и прочих извратах.

Bhudh

Цитата: Alone CoderСначала сделайте годный переводчик с французского на интерлингву.
Лучше с окситанского на пьемонтский.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

myst

Надо брать готовый движок и допиливать. Одному с нуля сделать нереально.

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Demetrius

Цитата: Alone Coder от сентября  9, 2010, 19:29
Сначала сделайте годный переводчик с французского на интерлингву. Если и при такой упрощённой задаче ничего не получится, то чего говорить о падежах, стилях речи и прочих извратах.
Делать перевод с одного языка, который не знаешь, на другой язык, который не знаешь — это очень-очень сложная задача, таки да рувэ нэ.

На самом деле, перевод на близкие языки достаточно нормально работает. Перевод с русского на беларусский настолько успешен, что ошибка/нестандартная форма, выдаваема переводчиком быстро успела распространиться..

Цитата: myst от сентября  9, 2010, 19:40
Надо брать готовый движок и допиливать. Одному с нуля сделать нереально.
А какой брать? Их не так-то много. Apertium?

myst

Цитата: Demetrius от сентября 10, 2010, 10:43
А какой брать? Их не так-то много. Apertium?
Я не в теме. Если их немного, я бы познакомился со всеми и выбрал тот, который меньше придётся допиливать до поставленной цели.

myst

На фордже куча проектов, связанных с переводом, но их просеивать надо. Там, чей поди, больше половины какие-нить памяти перевода и прочие локализаторские приблуды.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр