Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Программный генератор лексики, если лень

Автор arseniiv, июля 27, 2008, 20:47

0 Пользователи и 1 гость просматривают эту тему.

arseniiv

Если кого-нибудь интересует программный генератор слов (по набору правил) для какого-нибудь языка, то, пожалуйста, напишите. Тогда я выложу программу и справку. Если не интересует, тогда лучше пусть модераторы удалят эту тему, чтобы не мешала, потому что вряд ли прямое отношение к лингвистике имеет. Если всё же интересует, то любые пожелания принимаются с попыткой воплотить в жизнь

Nekto


ginkgo

"Θα φτιάξουμε μαρμελάδες."

Artemon

Цитата: arseniiv от июля 27, 2008, 20:47
Если кого-нибудь интересует программный генератор слов (по набору правил) для какого-нибудь языка, то, пожалуйста, напишите. Тогда я выложу программу и справку. Если не интересует, тогда лучше пусть модераторы удалят эту тему, чтобы не мешала, потому что вряд ли прямое отношение к лингвистике имеет. Если всё же интересует, то любые пожелания принимаются с попыткой воплотить в жизнь
Хм.
Не знаю, сопряжено ли это с тем, что предлагаете вы, но меня очень давно и плотно интересует следующая штука: задаёшь, скажем, 6 определённых языков, и программа на каждое заданное слово выдаёт некий средний между ними вариант (или несколько вариантов, после чего вручную можно выбрать тот либо же тот).
Это имеет отношение к вашей программе? Если да, то интересует даже очень.
За разнообразие в мире языков: //vk.com/lingvomir
    [li]Чёрное и белое - лишь условные абстракции. Но жить, навешивая ярлыки, куда проще.[/li]
    [li]Green ideas и глокая куздра сообщают, что главное – принцип. Слова меняются, модели остаются.[/li]
    [li]Хорошо кишинёвскому сыну тайца и египтянки.[/li]
    [li]Ругая эсперанто, предлагайте альтернативы. Многие в вашей стране смотрят голливудские фильмы без перевода?[/li]
    [li]Живой язык = мёртвый конланг + армия и флот.[/li]
    [li]Центру нужны единое мнение, единый язык и смиренные налогоплательщики.[/li]

arseniiv

Цитата: Artemon от июля 28, 2008, 14:32
Хм.
Не знаю, сопряжено ли это с тем, что предлагаете вы, но меня очень давно и плотно интересует следующая штука: задаёшь, скажем, 6 определённых языков, и программа на каждое заданное слово выдаёт некий средний между ними вариант (или несколько вариантов, после чего вручную можно выбрать тот либо же тот).
Это имеет отношение к вашей программе? Если да, то интересует даже очень.
Вы меня заинтересовали, хотя сейчас у меня не такая программа, а просто делающая слова из набора букв и правил, какие куда можно ставить. Я бы попробовал, как вы хотите, но просто со словами (вводишь просто слова, без указания, какие языки). Только вы приведите пример пожалуйста, каким способом (ну, может например, каким-нибудь усреднением согласных-гласных или просто выбором) из каких-либо слов сделать несколько средних (хотя бы 1 пример). Хотя, боюсь, даже с примером не получится...

Artemon

Ну, как минимум общие буквы, идущие в той же последовательности, можно выделять. То есть создавать некий такой трафарет будущего слова. Конечно же, тут есть такая маленькая хитрость, что писаться может по-одному, а читаться по-другому, но тут уже, естессно, медицина бессильна. :)
А вообще очень интересно, как работает аналогичная программа для логлана. Там же тоже вот что-то такое имело место.
За разнообразие в мире языков: //vk.com/lingvomir
    [li]Чёрное и белое - лишь условные абстракции. Но жить, навешивая ярлыки, куда проще.[/li]
    [li]Green ideas и глокая куздра сообщают, что главное – принцип. Слова меняются, модели остаются.[/li]
    [li]Хорошо кишинёвскому сыну тайца и египтянки.[/li]
    [li]Ругая эсперанто, предлагайте альтернативы. Многие в вашей стране смотрят голливудские фильмы без перевода?[/li]
    [li]Живой язык = мёртвый конланг + армия и флот.[/li]
    [li]Центру нужны единое мнение, единый язык и смиренные налогоплательщики.[/li]

arseniiv

Цитата: Artemon от июля 28, 2008, 20:49
Ну, как минимум общие буквы, идущие в той же последовательности, можно выделять. То есть создавать некий такой трафарет будущего слова.
Да, стоит попробовать, но это всё же кажется, работа для человеческого ума, а не для перебора с возвратами...
Цитировать
Конечно же, тут есть такая маленькая хитрость, что писаться может по-одному, а читаться по-другому, но тут уже, естессно, медицина бессильна. :)
А можно писать, как слышится ;)
Цитировать
А вообще очень интересно, как работает аналогичная программа для логлана. Там же тоже вот что-то такое имело место.
Ой, об этом к сожалению не знаю. Это для названия предикатов, да?

nihao

Цитата: Artemon от июля 28, 2008, 14:32
Цитата: arseniiv от июля 27, 2008, 20:47
Если кого-нибудь интересует программный генератор слов (по набору правил) для какого-нибудь языка, то, пожалуйста, напишите. Тогда я выложу программу и справку. Если не интересует, тогда лучше пусть модераторы удалят эту тему, чтобы не мешала, потому что вряд ли прямое отношение к лингвистике имеет. Если всё же интересует, то любые пожелания принимаются с попыткой воплотить в жизнь
Хм.
Не знаю, сопряжено ли это с тем, что предлагаете вы, но меня очень давно и плотно интересует следующая штука: задаёшь, скажем, 6 определённых языков, и программа на каждое заданное слово выдаёт некий средний между ними вариант (или несколько вариантов, после чего вручную можно выбрать тот либо же тот).
Это имеет отношение к вашей программе? Если да, то интересует даже очень.

Так уже есть логлан, хотите нью-логлан? И старый-то никто не учит.
ВРучную, батенька, лучше всего действовать, вручную.
Трое наскочат — первого заколи, второго застрели, третьему штыком карачун.
Суворов

Artemon

Ну как вам сказать, "никто"... Эсперанто тоже почти никто не учит... ;)
Но эдак можно и вовсе прийти к вопросу о смысле жизни. :)
За разнообразие в мире языков: //vk.com/lingvomir
    [li]Чёрное и белое - лишь условные абстракции. Но жить, навешивая ярлыки, куда проще.[/li]
    [li]Green ideas и глокая куздра сообщают, что главное – принцип. Слова меняются, модели остаются.[/li]
    [li]Хорошо кишинёвскому сыну тайца и египтянки.[/li]
    [li]Ругая эсперанто, предлагайте альтернативы. Многие в вашей стране смотрят голливудские фильмы без перевода?[/li]
    [li]Живой язык = мёртвый конланг + армия и флот.[/li]
    [li]Центру нужны единое мнение, единый язык и смиренные налогоплательщики.[/li]

nihao

Вообще я за то чтобы чего-нибудь новое делать, а не только "жить законом, данным Адамом и Евой". Но вот идея смешения корней лично для меня сомнительна. Я так понимаю, это чтобы каждый нашёл в слове что-то своё, так? Ну, возьмём мы птица+чирийя+бёд, получим чирбёдица или чиртибёд. Но ведь слова-то такого реально не будет ни у кого, оно ничьё.

про птичек ушло сюда: http://lingvoforum.net/index.php/topic,10927.0.html
Трое наскочат — первого заколи, второго застрели, третьему штыком карачун.
Суворов

arseniiv

Так выкладывать программу?
Она конечно же, про�та� (в �мы�ле получаемого результата), наверно, кто-нибудь видел лучше. �о, по крайней мере, можно избежать чего-нибудь вроде jkdtjklvm или oiaaiou.
Можно и�пользовать как буквы любые �имволы ASCII (� Unicode проблемы, е�ли кто-нибудь хотел бы и�пользовать �имволы МФ�) и по�ледовательно�ти из не�кольких �имволов (bh, dj, нъь, ai напр.), реги�тр �облюдает��. Опции программы, конечно, не в �амом удобном виде получили�ь.

Простите, это со мной проблемы, или с отображением? Первая часть этого сообщения видимо, как-то заюникодилась или что-то ещё, но отображается совсем ненормально.
Надеюсь, это моя личная проблема. Извините за оффтоп

arseniiv

Интересно, хоть кто-нибудь счёл это нужным или полезным, то что я тут навыкладывал? Вижу, были загрузки

Artemon

А чом би й ні? Сейчас работаю над конлангом.
Программу вашу скачал, посмотрел. Вроде всё работает, спасибо.
Просто пока до словаря не добрался. :)
За разнообразие в мире языков: //vk.com/lingvomir
    [li]Чёрное и белое - лишь условные абстракции. Но жить, навешивая ярлыки, куда проще.[/li]
    [li]Green ideas и глокая куздра сообщают, что главное – принцип. Слова меняются, модели остаются.[/li]
    [li]Хорошо кишинёвскому сыну тайца и египтянки.[/li]
    [li]Ругая эсперанто, предлагайте альтернативы. Многие в вашей стране смотрят голливудские фильмы без перевода?[/li]
    [li]Живой язык = мёртвый конланг + армия и флот.[/li]
    [li]Центру нужны единое мнение, единый язык и смиренные налогоплательщики.[/li]

BurSer

По-моему, здорово. Просто, интересно и удобно. Большое спасибо.

BurSer


ternonzang

Я писал аналогичные програмки, причём на javascript, генерили слова прямо в броузере :)
Использовал для правил ССV и т.п ( где сдвоенные согласные и гласные) фрактальную функцию. Можно использовать любую функцию, хоть даже мандельброда, главное, чтобы на выходе было два числа ( обычно в графике это координаты пикселя ). А дальше всё просто, привязываешь эти числа к масиву с буквами, в соответствии конечно с другими правилами. Вообще использование фракталов более продуктивно, чем просто случайные числа. Можно сразу сгенерировать и скинуть в файл целый лексикон, например 50 или 100 тысяч слов.
Изменяя параметры фрактальной функции, можно получить множество лексиконов.
И самое главное эти лексиконы будут более удобные для восприятия и заучивания.
Красиво е това, което обичаме.

ternonzang

в добавление... лучше такую програмку написать как макрос в Word или в Exel на VBA.
Красиво е това, което обичаме.

myst

Цитата: "ternonzang" от
лучше такую програмку написать как макрос в Word или в Exel на VBA.
В Excel'е уже убрали ограничение на количество строк в таблице?

Nevik Xukxo

Лучше бы генератор морфологии, фонологии сделать. Лексика - это уже дело десятое, можно и стибрить из каких-нибудь языков, благо копирайтов нету.  :umnik:

ternonzang

Цитата: myst от марта 28, 2009, 16:11
Цитата: "ternonzang" от
лучше такую програмку написать как макрос в Word или в Exel на VBA.
В Excel'е уже убрали ограничение на количество строк в таблице?
Надо глянуть на ограничения , вообще это не критично, так как кроме строк ещё и столбцы есть , клеток на всех хватит:)))
У меня парочку телефонных справочников  было в виде таблиц.
Красиво е това, което обичаме.

ternonzang

Цитата: Невский чукчо от марта 28, 2009, 16:15
Лучше бы генератор морфологии, фонологии сделать. Лексика - это уже дело десятое, можно и стибрить из каких-нибудь языков, благо копирайтов нету.  :umnik:
Морфология =это и есть правила формирования слова. Это можно сделать достаточно гибко. А фонология ... ну можно определить в правилах колличество звуков, с точки зрения програмирования, это всего лишь размер массива . .
Красиво е това, което обичаме.

myst

Цитата: "ternonzang" от
Надо глянуть на ограничения , вообще это не критично, так как кроме строк ещё и столбцы есть , клеток на всех хватит:)))
В том, который в Office 2003, 65535, если мне память не изменяет.

ternonzang

Цитата: "myst" от
В том, который в Office 2003, 65535, если мне память не изменяет.
Этого в принципе хватит доже в один столбик. )
Можно прогу сделать, чтобы она отдельно генерила корни слов и флексию,
по разным правилам, это бы время экономило и упростилась бы работа с морфологией.
Красиво е това, което обичаме.

Ванько

Цитата: Невский чукчо от марта 28, 2009, 16:15
Лучше бы генератор морфологии, фонологии сделать. Лексика - это уже дело десятое, можно и стибрить из каких-нибудь языков, благо копирайтов нету.
Генератор фонетики
http://www.zompist.com/sounds.htm
Lingvoforum has ruined my life.
-------------------------
ЛФ — это вообще к лингвистике мало имеет отношение. © RawonaM

arseniiv

Гостю, забыл, как зовут. Вместо VC - 0? Хм, точно не знаю, вы для них буквы подобрали в файле настроек, ведь если просто включить эти слоги, то там будет как раз 0, потому что по умолчанию поставлен.
ternonzang, ваш фрактальный алгоритм, как я понимаю, позволяет делать слова, как-то похожие по написанию (и по звучанию соответственно, несмотря на то, как озвучивать)? То есть, как будто взятые из определённого сложившегося языка. Тогда это просто замечательный алгоритм!

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр