Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Словарь

Автор arseniiv, декабря 26, 2011, 13:59

0 Пользователи и 1 гость просматривают эту тему.

arseniiv

(В первую очередь, я думал только над словарями для конлангов, хотя это ограничение класса языков не обязательно.)

Хочу создать формат для описания словарей приемлемой сложности (чтобы не было лишних вещей, но всё необходимое для качественного словаря было. К примеру, пометки, транскрипция по желанию), т. к. встречал только излишне большие и неподъёмные. Или с неестественной семантикой.

После того, как то, что нужно сделать в формате для словаря, мы обговорим до конца, будет программа для редактирования (хотя недавняя тема Deme. подняла во мне мысль о человекозаписываемом формате), которая будет экспортировать словари в [tex]\text{\TeX}[/tex] (при помощи советов Кваса), HTML и прочее по желанию. Техническое: если надо, можно сделать экспорт во что угожно, для чего пользователь написал библиотеку. Или же сделать экспортёры, с учётом открытости формата, прямо из текста словаря, а не из внутреннего представления.

Но меня сейчас интересует структура словаря. Что надо и что не надо. С точки зрения описания в файле. Синтаксис продумаем потом или вместе с.

Помогите! :)

arseniiv

Берём любимые бумажный, электронный словарь и конланг — и в путь!

Hellerick

Средствами Лингвовики можно сделать так, чтобы строчки кода вида

;девочка {{сущ.}} {{ж.р.}} {{ФТ|де́въчкъ}}: girl; lass

отображались бы как

Цитировать
девочка сущ. ж.р. [де́въчкъ]
        girl; lass

Или вам нужно что-то более серьезное?

arseniiv

Да, чтобы было немного больше возможностей без их описания текстом. Например, омонимы описывались бы без повторения заглавного слова, можно было бы вставлять, к примеру, примеры употребления и идиомы, указывать неправильно образуемые грам. формы и прочая, прочая; просто это надо сделать как-то естественно, а не так, как в XDXF с кучей не очень-то и нужных в простых, но удобных словарях. К тому же, экспорт в разные форматы или с разным оформлением (что-то показывать, что-то не показывать или сделать, к примеру, список слов, или разделить их как-нибудь на группы по смыслу) остаётся важным.

Самое абстрактное, словарь состоит из какой-то информации о языках оригинала и перевода (а можно в одном содержать два связанных словаря туда и обратно, чтобы ссылки были синхронные), прочего и словарных статей. Статья состоит из списка омонимов, статья об омониме состоит из отдельных кусков схожего значения, примеров и т. п.. Транскрипцию надо, наверно, цеплять к омонимам, а не ниже. Грамматические показатели тоже, наверно, к омонимам. (Всё это дело изменяемое. Это описание того, что я надумал месяцев несколько назад, а потом бросил.)

Мне вот именно детали нужны, потому что хочется, чтобы можно было удобным способом представлять словари. Я изх мало видел, совершенно не представляю, что может понадобиться, а о чём и заикаться не стоит.

Bhudh

Цитата: arseniiv от Транскрипцию надо, наверно, цеплять к омонимам, а не ниже.
Омонимы же не обязательно омофоны.
Или у тебя это значит омограф+омофон?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

arseniiv

Вообще-то, наверно, омографы. Я в последнее время запутался, но почему тогда в словарях пишут «омонимы»? Или не пишут?‥

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

arseniiv

Вот спасибо, не мог бы ты пояснить мне разницу между а)-б)-... и 1)-2)-..., и как это называется?

О, у них ошибка страшная при показе примеров к переводу. Ткни на яркий.

Не очень понятны все случаи, в которых могут употребляться скобочки (для всех мест).

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Bhudh

Цитата: arseniiv от не мог бы ты пояснить мне разницу между а)-б)-... и 1)-2)-...
1) Одно из значений
      а) Одна нюансина значения;
      б) Другая нюансина значения;
2) Другое из значений...

Разве нет?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

arseniiv

"You must live with the memory," she told [me] repeatedly in her heavy German accent.
Ты обязана хранить память [о нем], – говорила она со своим ярко выраженным немецким акцентом.

Сравни, какое слово является переводом какого. Я повыделял для простоты отделения. Они ищут неправильно, в общем корпусе, невзирая на такие ляпы!

Мало того, там ещё и ярко — наречие.

Цитата: Bhudh от декабря 26, 2011, 19:48
1) Одно из значений
      а) Одна нюансина значения;
      б) Другая нюансина значения;
2) Другое из значений...

Разве нет?
Как надо писать словарь, чтобы это было правильно с таким делением? Не очень ясно, как отделить значения от нюансин. Расскажи, я не знаю секрет! :???

Bhudh

А-а-а! Да, на соответствие всего отрывка внянья не обрал... Каю ся.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

arseniiv

Да не тебя надо каять, а... ну их.

Погляди, я там доответил.

Bhudh

Цитата: arseniiv от Как надо писать словарь, чтобы это было правильно с таким делением? Не очень ясно, как отделить значения от нюансин.
В идеале на каждый случай стоит дать простой сочетательный пример-два (с пометой iPod и под.).
И там уже смотреть, какие досочётные слова могут быть омножены...
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

arseniiv

Вы с Вадимием постепенно уходите куда-то beyound. Даже я так не писал, честное слово! Не понял смысл высказываний из-за некоторых таинственных элементов. Можно ещё разочек?

Bhudh

В идеале на каждый случай стоит дать простой пример-два на сочетание с теми словами, с которыми в этом значении он может быть сочитаем (с пометой и под.).
И потом уже смотреть, какие слова, добавленные к сабжу, могут быть объединены в одно множество по смыслу, и означить варианты с ними буквами (второй уровень вложенности, если он нужен, конечно)...

Цитата: arseniiv от Даже я так не писал, честное слово!
Да ладно тебе прибедняться, у меня все ходы тома записаны! :negozhe:
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Квас

А мне кажется, словари нельзя подогнать к общему знаменателю. Может быть, стоит взять за основу совершенно конкретный словарь?
Пишите письма! :)

Alone Coder

Лингво теперь онлайн? Что они с этого имеют?

O

Цитата: Alone Coder от декабря 26, 2011, 21:04
Лингво теперь онлайн? Что они с этого имеют?
Теперь?
gdy padła granica, pękły więzień bramy,
w ten dzień wyzwolenia: siedemnasty września

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

arseniiv

Offtop
Цитата: Bhudh от декабря 26, 2011, 21:01
Да ладно тебе прибедняться, у меня все ходы тома записаны! :negozhe:
Ну-ка-ну-ка? :) (Мне интересно, что ты из всего того выбрал бы.)

Цитата: Bhudh от декабря 26, 2011, 21:01
и под.
Что это значит?

Alone Coder

А если я подумаю и решу обидеться?

arseniiv

А чей аватар справа?

* arseniiv — Не разводите оффтоп! И ты тоже.

Bhudh

Цитата: arseniiv от Что это значит?
Так мало философских книжок читал? И под(обные (случаи)).


Цитата: Alone Coder от А если я подумаю и решу обидеться?
Prīmō. ≈ ≠ =.
Sēcūndō. Почему один рисунок должен обижаться на другой?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

arseniiv

Цитата: Bhudh от декабря 26, 2011, 21:22
Так мало философских книжок читал?
Не так мало, а 0. :eat: Моя философия вся изнутри!

А чей справа аватар?