Как известно, для многих конлангеров (для меня, в том числе) камнем преткновения становится словарный состав. По крайней мере, если язык создаётся апостериорный. Поэтому, я решил попробовать создать список базовой лексики. Он разбит по темам. Предлагаю заценить, дополнить, вообще подключиться к разработке. Но есть один нюанс: антонимы являются однокоренными словами. В списке разделены знаком /.
Поехали.
Части тела:
голова
волос/шерсть
ухо
рог
бровь
глаз
ресница
нос
рот
зуб
язык
лоб
затылок
лицо
висок
челюсть
шея
тело
грудь
рука/лапа
плечо
предплечье
кисть
палец на руке
локоть
крыло
живот
спина
хвост
нога/лапа
бедро
голень
стопа
копыто
палец на ноге
ноготь/коготь
молочные железы/вымя
перо
чешуя
колено
половые органы
Внутренние органы:
мозг
горло
пищевод
желудок
кишка
сердце
лёгкое
печень
железа
пузырь
яйцо
спинной мозг
Ткани:
кожа/шкура
мышца/мясо
кость
кровь
жир
Скелет:
череп
позвоночник
ребро
таз
Неживая природа:
земля
камень
гора
яма
пещера
песок
пыль
галька
вода
капля
лужа
пруд
озеро
море
ручей
река
ущелье
небо
воздух
облако
туча
снег (лежит)
лёд
огонь
дым
туман
место
Светила:
солнце
луна
звезда
Явления природы:
ветер
дождь
град
снег (идёт)
молния
Флора:
растение
трава
стебель
лист
цветок
корень
семя
дерево
ствол
ветка
плод
куст
гриб
колючка
Фауна:
животное
беспозвоночное
рыба
рептилия
птица
млекопитающее
Способ питания:
хищничество
травоядность
всеядность
падальничество
Передвижение и другие действия:
ползание
хождение
бег
полёт
плавание
сидение
стояние
лежание
Физика:
скорость
время
расстояние
температура
масса
звук
освещённость
Пространство:
длина
ширина
высота
пустота
размер
Пришла идея читать слова наоборот :-)
Нефизическое время:
зима
весна
лето
осень
утро
день
вечер
ночь
Процесс и расположение:
начало
середина
конец
верх
низ
правая часть
левая часть
Цвета:
белый
чёрный
красный
зелёный
синий
жёлтый
тёмный/светлый
блёклый/яркий
Счёт:
один
два
три
четыре
пять
Философия:
количество
качество
форма
содержание
цель
средство
бытие
часть
целое
общее
частное
материя
метод
Местоимения:
я
мы
ты
вы
этот/эта
эти
тот/та
те
Состояние материи:
твёрдое
жидкое
газообразное
Чувства:
зрение
слух
обоняние
осязание
вкус
Физиологические процессы:
еда
питьё
мочеиспускание
дефекация
эякуляция
сон
рвота
Отходы жизнедеятельности:
кал
моча
Жизненный цикл:
рождение
жизнь
смерть
Антропология и родство:
человек
родитель
потомок
родственник
Геометрия:
сторона
грань
ребро
круг
центр
площадь
объём
Абстракция:
отличие
объект
Социальная сфера:
жилище
ёмкость
одежда
поселение
взаимодействие
инструмент
предмет
отношение
речь
общение
вопрос
принадлежность
имя
Результат действия:
след
Реакция на внешние раздражители:
боль/наслаждение
холод/тепло
жажда/удовлетворение
голод/сытость
страх/бесстрашие
усталость/бодрость
слабость/сила
агрессия/миролюбие
огорчение/радость
согласие/несогласие
Пока это всё...
Есть ещё специальный показатель, помогающий разделять противоположные по смыслу слова: положительное/отрицательное, либо +/-.
Если есть идеи по дополнению категорий или каким-то изменениям, прошу делиться! Возможно, общими усилиями отшлифуем список и дальнейшее творчество у многих пойдёт легче :)
слабость/сила
слабость/неслабость
тсобалс/тсобалсен
cobals/cobalsen
Годиться? Выходит такое японское отрицание ^_^
Цитата: DarkMax2 от октября 24, 2014, 09:30
слабость/сила
слабость/неслабость
тсобалс/тсобалсен
cobals/cobalsen
Годиться? Выходит такое японское отрицание ^_^
Если у Вас родилась именно такая идея конланга - почему нет? Попробуйте :)
Цитата: Gwyddon от октября 24, 2014, 09:03
Способ питания:
хищничество
травоядность
всеядность
падальничество
А есть естественные языки, где под эти значения есть специальные непроизводные слова?
Или ваш список не ограничивается непроизводными (но тогда он будет очень большим)?
Цитата: Тайльнемер от октября 24, 2014, 09:36
А есть естественные языки, где под эти значения есть специальные непроизводные слова?
Или ваш список не ограничивается непроизводными (но тогда он будет очень большим)?
В естественных языках обычно наоборот: от конкретного к абстрактному.
Мой список должен по максимуму состоять из непроизводных основ.
А для чего нужны непроизводные слова вместо логичных «едящий мясо», «едящий растения», «едящий падаль», «едящий всё»?
Цитата: Тайльнемер от октября 24, 2014, 09:53
А для чего нужны непроизводные слова вместо логичных «едящий мясо», «едящий растения», «едящий падаль», «едящий всё»?
Я имел ввиду то, что базовая лексика должна состоять из непроизводных слов. Которые уже нельзя разложить на составляющие. Далее словарный фонд пополняется как раз за счёт корнесложения, аффиксации и т.д.
На счёт "едящий мясо" и т.п. смысл в том, что подобные корни (если эти слова непроизводные) можно использовать для названий животных, к примеру. Если эти понятия дробить дальше, производные слова будут удлиняться.
В LCS уже проделали подобную работу на английском. Ознакомьтесь.
Цитата: Yitzik от октября 24, 2014, 10:41
В LCS уже проделали подобную работу на английском. Ознакомьтесь.
Щаз посмотрю, спасибо. А то, может, велосипед изобретаю... :???
Анна Вежбицкая. Универсальные семантические примитивы как ключ к лексической семантике (сфера эмоций) (http://ailab.ho.ua/Wergbitska/UniSemPrim.htm)
Toki-Pona - English Dictionary (http://rowa.giso.de/languages/toki-pona/english/latex/Toki_Pona_English.html)
Семантический минимализм от участника Лингвофорума АМ (http://lingvoforum.net/index.php/topic,12717.msg208312.html#msg208312)
И наконец, мой словарь для недоделанного автоматического генератора конлангов.
ЦитироватьVERB INTRANSITIVE ABL ALL ILL
двигаться
идти ++двигаться
пойдти +++начать-идти
начинаться пасс-начать
заканчиваться пасс-закончить
выйти(выходить) +++вы-идти
ходить ++дл-идти
прийдти(приходить) +++результ-идти ++дойти
дойти(доходить) ++прийти +++результ-идти
уйти(уходить) +++прочь-идти +++прочь-пойти
войти(входить) +++в-идти
разойтись(расходиться) вокруг-идти
пройти(проходить)[идти_мимо] ++мимо-идти +++через-идти
пройти(проходить)[заканчиваться] ++заканчиваться ++пролететь
сойти +++вниз-идти
взойти +++вверх-идти
обойти +++вокруг-идти
бежать
вбежать +++в-бежать
выбежать +++вы-бежать
убегать +от-бежать ++быть-трус
Насколько я могу сейчас разобраться в системе обозначений.
Части речи обозначены ключевыми словами VERB/NOUN/ADJECTIVE/ADVERB (куда попадают предлоги)/MISC(частицы, союзы и т.п.).
В скобками обозначены альтернативные написания слова, т.е. 'уйти(уходить)' означает, что для русских слов 'уйти' и 'уходить' должна быть одна словарная статья.
Цитироватьвзять[с_места](брать) LOC ABL
взять[у_человека](брать) ABL-A
Квадратные скобки означают разбиение понятий, обозначаемых в русском одним слово: например, 'взять' может быть разбито на две словарные статьи 'взять[с_места]' и 'взять[у_человека]'.
Плюсами обозначаются возможные этимологии.
Количество плюсов(1-5) означает вероятность этимологии.
Чем больше плюсов, тем больше вероятность, что машина сгенерирует слово исходя из указанной этимологии, а не будет подбирать новый корень.
Обычно этимология указывает в форме 'вбежать +++в-бежать', где три плюса указывают высокую вероятность подобной этимологии; 'в-' представляет собой модификатор (как он будет выглядеть - суффиксом или префиксом - будет зависеть от результата генерации грамматики); 'бежать' модифицируемое слово.
Возможны этимологии без модификатора: 'заблудиться ++ошибаться' означает, что со средней вероятностью (++) понятия 'заблудиться' и 'ошибаться' будут объеденены в одну словарную статью как синонимы.
У глаголов указан тип согласования: TRANSITIVE означает возможность принимать винительный актант, INTRANSITIVE - запрещает, всевозможные 'DAT', 'LOC' и т.д. отвечают за косвенные актанты.
Ключевые слова могут быть указаны как после конкретного глагола, так и после ключевого слова VERB, в последнем случае, они будут относиться ко всем нижележащим словам.
У существительных указывается именной класс (ANIM, CORP, PLACE и т.д.), он также может указываться как для конкретного слова, так и для группы слов под тегом NOUN.
Астериском * обозначены индоевропейские корни; машина может генерировать лексику из этих корней, тогда конланг получится псевдо-ие.
Эх, доделать бы программу...
Раскопки на ЛФ дали минималистический конланг участника starrats от 2010 года: Суперконланг от СтарратС (http://lingvoforum.net/index.php/topic,26155.msg580820.html#msg580820%3Cbr%20/%3E)
Не надо минималистический. Надо удобный.
Если Упрощенный английский ( Simple English ) более упростить?
Rick Harrison's Universal Language Dictionary (ULD) (http://lingwadeplaneta.info/files/wordlist.shtml)
Прям очень. Потрудился автор, дело на мой взгляд для конлангеров необходимое.
Пытался в своё время тоже сделать нечто подобное, собирая со списков 50/100/200 глаголов/прилагательных/самых употребимых слов с тематических словарей английского, немецкого и прочих языков.
Проблема в том, что даже базовый словарь сильно завязан на структуру языка. Как быть, если в языке фактически нет прилагательных, например?..
От списка базовой лексики от Gwyddon-а со словами "площадь" и "взаимодействие" всплакнул. В моем базовом списке около 650 лексем и морфем, но вот ни "грани", ни "агрессии" там, увы, нету...
По какому критерию эта лексика базовая? Больше похоже на случайный набор слов.
Самая базовая лексика это список Сводеша.
Цитата: kemerover от ноября 19, 2015, 20:26
Самая базовая лексика это список Сводеша.
Только его очень мало.
В отношении конланга "базовая" лексика, на мой взгляд, подразумевает разговор на простые темы.
Цитата: Awwal12 от ноября 19, 2015, 20:36
В отношении конланга "базовая" лексика, на мой взгляд, подразумевает разговор на простые темы.
Ну он даёт возможность составить какие-то самые базовые фразы и диалоги на уровне пещерных людей. Всё, что чуть более сложнее очень зависит от структура языка, как вы верно подметили. Иногда в языках даже самые базовые понятия не совпадают и значения перекрещиваются разными словами. Особенно заметно в предлогах.
В чём проблема с базовым словарём? Если конланг затачивается на современность и общение, берётся список 1000 (https://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%A1%D0%BF%D0%B8%D1%81%D0%BE%D0%BA_%D1%81%D1%82%D0%B0%D1%82%D0%B5%D0%B9,_%D0%BA%D0%BE%D1%82%D0%BE%D1%80%D1%8B%D0%B5_%D0%B4%D0%BE%D0%BB%D0%B6%D0%BD%D1%8B_%D0%B1%D1%8B%D1%82%D1%8C_%D0%B2%D0%BE_%D0%B2%D1%81%D0%B5%D1%85_%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2%D1%8B%D1%85_%D0%B2%D0%B5%D1%80%D1%81%D0%B8%D1%8F%D1%85) или даже 10000 (https://meta.wikimedia.org/wiki/List_of_articles_every_Wikipedia_should_have/Expanded) статей, которые должны быть в каждой Вики, выпиливаются апеллятивы, вуаля! — готов список существительных. Прилагательные и глаголы добавляются по совместимости.
Если на какой-то альтернативный/фэнтезийный/сказочный мир — берутся "реалии" (как их назвать-то? "Фантазарии"?) этого мира.
Если тупо початиться: тут достаточно языка Эллочки-людоедки или ещё более жоского варианта:
Можете сами посчитать, сколько используется лексем.
Цитата: Bhudh от ноября 19, 2015, 21:14
Если конланг затачивается на современность и общение, берётся список 1000 или даже 10000 статей, которые должны быть в каждой Вики
Общение энциклонгов? :o
Я чаще всего оптимизировал лексику на реалии верхнего палеолита, но чего-то специфического там минимум (скорее, показательно отсутствие многих позднейших культурных реалий типа "окно" и пр.).
Цитата: Awwal12 от ноября 19, 2015, 21:16Общение энциклонгов? :o
Общение на любые современные темы (и составление/чтение викистатей на конланге, собственно).
Цитата: Bhudh от ноября 19, 2015, 21:24
Цитата: Awwal12 от ноября 19, 2015, 21:16Общение энциклонгов? :o
Общение на любые современные темы (и составление/чтение викистатей на конланге, собственно).
Какой вменяемый человек в нормальной бытовой беседе использует слова "материализм", "Сатьяджит Рай", "классическая механика" и "Месопотамия"?..
Лингвофорумчан не предлагать.
А чтобы общаться на тему темной материи или андроновской культуры, вам этого списка заведомо не хватит.
Здесь
http://ru.lernu.net/komunikado/forumo/temo.php?t=16776
сделал списки (из 530 и 850) базовых морфем эсперанто.
Учитывал частотность и семантику.
Есть минимальная избыточность/зависимость, поскольку
возникает однообразие для высокочастотных морфем и сильный
уклон от традиции. При желании дубли легко удалить (но оставлялись только удобные
высокочастотные). Кроме того, можно удалить некоторые табличные слова
(но В системе они легко запоминаются, как некоторое "бесплатное" дополнение).
Требования к морфемам были такие.
1. Высокая частотность.
2. С помощью них можно просто выразить понятия для бытового
общения, туризма, начального образования (полнота и замкнутость)
3. Относительная независимость, если это не противоречит 1.
4. Можно выучить человеку со слабыми способностями за 2-3 месяца.
5. Это морфемы первой ступени в изучении эсперанто, пополненные требованием 2.
А если конланг для общения между инопланетянами?
У клингонцев важным является слово 'uH - похмелье. Почему его не сделать базовым?