Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Генератор языков

Автор shinkarom, августа 12, 2009, 15:05

0 Пользователи и 1 гость просматривают эту тему.

arseniiv

Я не удмал парировать. Мне кажется, что-то более-менее пригодное всё же в силах сделать. Просто надо понять. Неизвестно что.

Теос Мегалион

А есть программы, которые могут создать язык не с нуля, а с определённого списка значений слов?
И как примерно работает эта программа - её можно использовать для своего языка? (ЛангГен которая)

arseniiv

Описания всех программ в этой теме есть в этой же теме.

Цитата: Теос Мегалион от июня 18, 2011, 16:26
А есть программы, которые могут создать язык не с нуля, а с определённого списка значений слов?
Лексика отнюдь не главное в языке! И, если уж программа будет создавать грамматику сама, зачем ей вообще какой-то список слов? Она может обобщёнными оперировать в описании грамматики.

shinkarom

Я все-таки решил вернуться к теме создания генератора языков.
Мой блог //allthetongues.hol.es

DeSTRUCTOR

Интересная мысль! (Извиняюсь, только сегодня прочитал эту тему)... Я тоже пробовал экспериментировать с написанием такого рода программ, но правда так широко не брал, а ограничился автоматической генерацией корней по заданному шаблону. т.е. в качестве входных параметров программа получала наборы фонем и структуру корней: например: V:a,o,u,i,e; C:t,d,p,b... S:r,l,m,n... CVC, CV, CVRC...., а сама программа для отдельного слава(корня) из списка случайным образом выбирала сначала тип корня, а затем, последовательно заменяла каждый условный символ группы, на случайную фонему из этой группы. например: CVC->kap... я написал такую программу только потому. что мне лень было работать с лексикой, сладким для меня было все остальное... и честно говоря, я даже не задумывался над тем, что бы генерировать язык полностью... а вот сейчас...
Поэтому поводу у меня к автору есть конструктивное предложение по написанию программы-генератора: (хоть это и мое сугубо личное мнение) программа поэтапно строить язык, а не весь сразу. приблизительно в таком порядке:
1) фонемы
2) типы слогов и корней по фонетическому составу
3) корни
4) морфологический и синтаксический тип
5) систему словообразовательных и формообразовательных суффиксов, префиксов, инфиксов и т.д. исходя и предыдущего пункта
6) формирование парадигм. (падежные, личные и т.д. окончания или префиксы,)
7) моделирование фонетических законов.
8) создание полного словаря всех слов и их словоформ.

так же здесь можно использовать шаблоны по уже имеющимся языкам.


Я думаю написание такой программы будет трудоемким, и вряд ли она сможет обладать достаточной степенью свободы. что бы сгенерировать языки, которые бы друг от друга отличались с такой же степенью. как друг от друга отличаются китайский язык и например кечуа. Но задача интересная. стоит попробовать, а с нашей стороны поддержать  и помочь по мере сил автору, хотя бы с формированием списка первичных корней, который бы отражал все необходимые понятия, и мог быть успешно применен для расширения словарного запаса до уровня естественных языков.

хотя еще есть второй способ: как уже было сказано раньше и кстати частично реализовано на практике. можно взять полный список всех слов (например словарь Ожигова, только более полный и в котором есть все словоформы)))) ), а потом каждому слову/ словоформе сопоставить произвольную последовательность фонем. чисто теоретически получившийся язык сразу будет обладать грамматикой, только оооочень сложной и непонятной. Будет наверное забавно потом изучать получившийся язык и писать к нему грамматику))) Кстати, поясню почему надо словоформы (вода, воды, воде, воду...) тоже включить в список. Если делать так как автор делал раньше, отдельно слова отдельно окончания, то или язык по умолчанию будет агглютинативным, что противоречит задаче о создании программы создающей любой язык, или же все равно придется отдельно продумывать законы соединению основ с окончаниями, т.е. язык не будет полным.

DeSTRUCTOR

p.s.: последняя версия программы мне, кстати очень понравилась, достойно уважения. программа даже сразу учебник сформировала.

shinkarom

Спасибо за поддержку. Мне как раз очень нужны фаны.
Я создам сайт на WordPress и выложу на него ссылку.
Мой блог //allthetongues.hol.es

arseniiv

Цитата: DeSTRUCTOR от сентября 29, 2013, 23:13
Я тоже пробовал экспериментировать с написанием такого рода программ, но правда так широко не брал, а ограничился автоматической генерацией корней по заданному шаблону. т.е. в качестве входных параметров программа получала наборы фонем и структуру корней: например: V:a,o,u,i,e; C:t,d,p,b... S:r,l,m,n... CVC, CV, CVRC...., а сама программа для отдельного слава(корня) из списка случайным образом выбирала сначала тип корня, а затем, последовательно заменяла каждый условный символ группы, на случайную фонему из этой группы. например: CVC->kap...
Есть программа более настраиваемая, может даже фразы и тексты генерировать (если хорошенько над грамматикой поработать): http://arseniiv.info/progr/lexicgen. Правда, нужен .NET Framework 2, но ссылка на загрузку прям там же и стоит. Если я плохо описал, как писать грамматики, спрашивайте! (Правда, я нерегулярно просматриваю как ЛФ, так и сайт, но когда увижу — отвечу.)

(Сам я пока с генераторами языков дела иметь не желаю, потому что слишком уж они сложные для автоматизации их создания мной.)

Offtop
Цитата: DeSTRUCTOR от сентября 29, 2013, 23:13
например словарь Ожигова
Ну, во-первых, он совершенно далеко от «полного списка всех слов», а, во-вторых, Ожёгова, да и не только он один его писал. ;)

tempuser

Offtop


Цитировать
Цитата: DeSTRUCTOR от сентября 29, 2013, 23:13
например словарь Ожигова
Ну, во-первых, он совершенно далеко от «полного списка всех слов», а, во-вторых, Ожёгова, да и не только он один его писал. ;)

Как бэ  Ожёгов (wiki/ru) Ожегов
do co'e i ko cu'e mo (непереводимо с ложбана)
Общий аккаунт ложбанистов.
"Ученые сейчас не исключают, что вся европейская цивилизация произошла от человекоподобных грузин, которые со временем расселились с гор. (Комсомольская правда)"
ob aičnaţwiub âriţw üokwattâr üotratt - Зелёные бесцветные идеи яростно спят (на ифкуиле).

shinkarom

Сейчас я переписываю приложение на более правильный объектно-ориентированный код (как мало я тогда знал о программировании!).
Выкладываю версию с незначительными улучшениями с установщиком Inno Setup.

http://shinkar.16mb.com/langgen/
Мой блог //allthetongues.hol.es

Awwal12

Генерировать словарь просто, причем программы тут создают широчайшие возможности для кастомизации звучания языка.
Генерировать же язык как таковой... Оххохо.
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

arseniiv

Цитата: shinkarom от октября  1, 2013, 11:56
Выкладываю версию с незначительными улучшениями с установщиком Inno Setup.
Неплохо было бы иметь как установщик, так и архив для установки руками, многие любят это!

Offtop
Цитата: tempuser от октября  1, 2013, 09:22
Цитировать
Цитата: DeSTRUCTOR от сентября 29, 2013, 23:13
например словарь Ожигова
Ну, во-первых, он совершенно далеко от «полного списка всех слов», а, во-вторых, Ожёгова, да и не только он один его писал. ;)
Как бэ  Ожёгов (wiki/ru) Ожегов
Оу. Как легко ошибки накапливаются, надо запомнить.

shinkarom

Выложил в формате .rar. Ссылка та же.
Хотелось бы узнать ваши мнения о том, что можно улучшить непосредственно (в смысле сейчас же, а не переписывать весь код с нуля).
Планирую добавить в программу суффикс множественного числа.
Мой блог //allthetongues.hol.es

arseniiv

Почитайте на досуге Плунгян В. А. «Общая морфология», наверняка пользу принесёт.

shinkarom

Мой блог //allthetongues.hol.es


arseniiv


shinkarom

Мой блог //allthetongues.hol.es


arseniiv

Цитата: shinkarom от октября  3, 2013, 19:42
Придется красть его код.
Он же не Perl'е, вы что! :uzhos: (А если серьёзно, то там столько страниц кода, что я даже решил его не читать.)

shinkarom

Мне придется это делать. Мои познания о генерации фонетики очень скудны. Правда, на это уйдет не версия и не две...
Мой блог //allthetongues.hol.es

shinkarom

Я продолжаю работать над программой, только застопорился на фонемах с символами IPA (если точнее, с тем, что ихняя запись в HTML занимает не один , а больше символов).
Если бы я создал сайт, заходили бы вы на него?
Мой блог //allthetongues.hol.es

Тайльнемер

Цитата: shinkarom от октября 22, 2013, 10:55
застопорился на фонемах с символами IPA (если точнее, с тем, что ихняя запись в HTML занимает не один , а больше символов).
А в чём именно проблема?
И почему не использовать кодировку UTF-8 на странице и не писать символы МФА как есть, одним символом?

shinkarom

Вообще-то дело не в этом, а в том, что необходимо создать классы TPhoneme и TPhonemeString, а у меня недостаточно опыта.
Мой блог //allthetongues.hol.es

shinkarom

Нет, не получается. Оказывается, Delphi 2010 не полностью поддерживает Unicode.
Мой блог //allthetongues.hol.es

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр