Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Генератор языков

Автор shinkarom, августа 12, 2009, 15:05

0 Пользователи и 1 гость просматривают эту тему.

arseniiv

Ну вот, не зря сомневался. Этот сайт действительно не работает. Если нужен будет этот модуль (а справка там, и русская тоже, есть), то поищите на //www.torry.net, оттуда брал

Вадимий

Нет у кого-нибудь частотного словаря для моей программы?
P. S. Если никто не ответит, мне ждать, или выкладывать версию, где слова почаще не будут покороче?

arseniiv


myst

Цитата: arseniiv от августа 18, 2009, 17:32
Но моя Delphi [у меня тоже она, притом 7, и притом она какая-то испорченная и иногда нормальный код не компилирует] что-то виснет при присвоении нормального свойства нормальному уникодному компоненту.
Мыши плакали, кололись, но продолжали грызть... ;)

myst

Цитата: Вадимий от августа 19, 2009, 13:33
Нет у кого-нибудь частотного словаря для моей программы?
Частотный словарь какого языка?

arseniiv

Нет, это лично моя Delphi какая-то ненормальная, а починить её лень, скачать нормальную версию тоже лень.....

myst


myst

Цитата: arseniiv от августа 19, 2009, 20:28
Нет, это лично моя Delphi какая-то ненормальная, а починить её лень, скачать нормальную версию тоже лень.....
Ага-ага. ;D

arseniiv

Показалось, думаю. В начале - может. Но не в конце.

Вадимий

Цитата: myst от августа 19, 2009, 20:28
Цитата: Вадимий от августа 19, 2009, 13:33
Нет у кого-нибудь частотного словаря для моей программы?
Частотный словарь какого языка?
Древнекитайского.

Вадимий




Вадимий

Цитата: myst от августа 21, 2009, 01:01
Цитата: Вадимий от августа 20, 2009, 13:42
Русского
Я в какой-то теме недавно давал ссылки. Yet another
Спасибо, но мне нужно побольше. В том словаре, который побольше, слова в всех формах,а там, где только в начальной, всего 5000 слов. Нужно побольше.

Вадимий

Выкладываю чуть-чуть изменённую версию. Прошу отзывов.

arseniiv

Хоть я и не разбираюсь в генераторах языков. При "переводе" списка всех слов программа у меня надолго отрешилась от операционной системы, и потом я решил закрыть. В общем, неплохо, но один раз сгенерировался список согласных из одной буквы d ;D - помню, вы говорили, что раньше у вас попадались часто списки гласной из 1 шт. Каким "странным" способом вы генерируете списки букв? :o

Кстати, если брать достаточно большой словарь, то там внизу же будут такие слова, которые чисто случайно могли попасть. Т.е. слова с большой вероятностью "прыгают" по спискам, составленным из разных источников не так сильно, как слова с маленькой... То есть увеличивать длину списка неоправданно из-за флуктуаций всяких терминов и т.д., как например, в этих списках - политических (там как раз указано), хотя верхние слова почти в любом списке, составленном из русских источников, будут те же.

Вадимий

Цитата: arseniiv от августа 21, 2009, 15:00
Хоть я и не разбираюсь в генераторах языков. При "переводе" списка всех слов программа у меня надолго отрешилась от операционной системы, и потом я решил закрыть. В общем, неплохо, но один раз сгенерировался список согласных из одной буквы d ;D - помню, вы говорили, что раньше у вас попадались часто списки гласной из 1 шт. Каким "странным" способом вы генерируете списки букв? :o

Цитата: Вадимий от августа 21, 2009, 06:50
Спасибо, но мне нужно побольше. В том словаре, который побольше, слова в всех формах,а там, где только в начальной, всего 5000 слов. Нужно побольше.
А зачем вам формы? :o Разве они не должны придумываться, исходя из списков на форме?
Вы меня не поняли. В словаре, который побольше, существительные во всех падежах и числах,, глаголы во всех временах, родах или лицах, а в словаре, где глаголы в инфинитиве, а существительные в им. п. ед. ч., всего 5000 слов.

Вадимий

Цитата: arseniiv от августа 21, 2009, 15:00
А, понял! Словарь с большим количеством слов содержит все формы, а надо как раз начальную, а она есть в словаре на 5000 слов, но этого мало
Именно!

Bhudh

Мне показалось или новая версия стала выглядеть кривее?
Кстати, структура слова по-прежнему только CVCV. Неужели CVCVC или VCVCV не нравятся Вадимию?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

arseniiv

Снова изменил своё сообщение :)

Цитата: Bhudh от августа 21, 2009, 15:24
Кстати, структура слова по-прежнему только CVCV. Неужели CVCVC или VCVCV не нравятся Вадимию?
Может, группировать "правильно" слоги не очень удобно? В моём страшном генераторе слов, если включить слоги VC и CVC например, будут генерироваться из них такие штуки, которые не соответствуют "инструкции": CVC-VC > CV-CVC, CVC-VC-CVC > CV-CV-CCVC и подобное же с другими. Например, тип V вообще надо включать только по особой необходимости - он комбинируется нормально только с CV: CV-V, V-CV. А CVC-V > CV-CV. Но вообще это, конечно, обысно ничего плохого давать не даёт...

Вадимий

Цитата: Bhudh от августа 21, 2009, 15:24
Мне показалось или новая версия стала выглядеть кривее?
Кстати, структура слова по-прежнему только CVCV. Неужели CVCVC или VCVCV не нравятся Вадимию?
Я думал о грамматике - "А остальное всё приложится" :) Спасибо, что напомнили.


arseniiv

Немного поиграл с SED'ом и списком слов от myst'а. Сделал транслитерацию русских слов и смену окончания у глагола, и ещё немного начудил с гласными. И устал ;D

arseniiv

Цитата: shinkarom от августа 21, 2009, 16:57
Вот моя новая версия
Ага. Комментируем :)
- Ошибки таблицы: часто вылезают около букв h, j, l. (на скриншоте)
- слово[транскрипция]: лучше поставьте пробел
- жалко, что только 26 неизменяемых букв
- звуки, привязанные к буквам, можно брать в транскрипции МФА. Правда, на Delphi для ввода уникодных символов придётся использовать их код: #код.
- интересно сделано: звуки привязаны к буквам; но было бы лучше ещё больше звуков сделать
- словарь можно потом увеличить тоже
- можно генерировать самоназвание языка на этом же языке. А на русский переводить транскрипцией (для каждого использованного звука МФА придётся сопоставить букву, как вы сопоставляли буквы звукам).

Bhudh

Цитата: shinkaromВот моя новая версия
Цитата: Словарь чувайтского языка
в - k[к]
не - k[к]
с - v[в]
а - b[б]
из - b[б]
на - d[д]
Всё-таки из структур слов чистое c лучше убрать, ограничиться подмножеством сонорных.
Между словом и транскрипцией принято ставить пробел, иначе это означает транскрипцию части слова.
А чувайтские в и не интересно совпали, по латинскому варианту.


Цитата: arseniivможно генерировать самоназвание языка на этом же языке
Мне показалось, так и делается.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр