Искусственные языки обычно простые, лёгкие для изучения (ну, волапюк вроде не очень простой язык), да и предназначены для возможно большего количества людей, а то и для всего мира. А если наоборот: придумать язык для какой-то тайной организации или просто для отдельной группы людей, а для посторонних он будет совершенно непонятным? Вот так: язык непохожий ни на 1 другой, письмо иероглифическое (но не китайские иероглифы, а новое письмо, которое ещё надо придумать). Может для полного счастья ещё и грамматику покруче чем в табасаранском языке (там 48 падежей, а ведь можно и больше), самые разнообразные мыслимые и немыслимые звуки (может, даже издаваемые не только ртом), 3 степени долготы, 10 тонов? Думаю, достаточно первых 2 сложностей (изолят и иероглифическое письмо). Ну да, что устный язык, что письменный - хрен поймёшь, всё равно что инопланетный. В процессе обучения как вспомогательное можно использовать какое-то специально придуманное буквенное письмо (чтобы чужие уж никак не смогли изучить этот язык).
Можно придумать и язык, и письмо для него (уж сколько времени это займёт?), но насколько востребован будет этот язык? Так что пока только идея, но всё равно можно обсудить.
Я бы подключился к созданию :)
Интересная тема. Если-бы не усиленная работа надъ Венедчиной въ парѣ съ неуогомоннымъ полякомъ, я-бы тоже подключился (какъ-то и самъ нечто подобное придумывалъ: бралъ случайную комбинацію звуковъ и придумывалъ ей значеніе. Алфавитъ былъ греческій, но съ измѣнёнными значеніями многихъ буквъ.).
Цитата: Mercurio от сентября 1, 2013, 22:09
Я бы подключился к созданию :)
К сожалению, вы опоздали. :'(
Цитата: Unicum от сентября 1, 2013, 22:04
Думаю, достаточно первых 2 сложностей (изолят и иероглифическое письмо). Ну да, что устный язык, что письменный - хрен поймёшь, всё равно что инопланетный. В процессе обучения как вспомогательное можно использовать какое-то специально придуманное буквенное письмо (чтобы чужие уж никак не смогли изучить этот язык).
Как раз наоборот - иероглифическое письмо - самая большая дыра в защите от расшифровки, какую только можно придумать :) Подумать только: корень или иная морфема всегда пишутся одинаково, и не подвержены фонетическим модификациям (даже если в устном языке эти модификации есть в полный рост, и даже если там царит самая хаотическая фузия). Да это же просто подарок расшифровщику письменного текста. Не, надо всё-таки фонетическое письмо. Может быть, слоговое, тогда да, в сочетании с умлаутами, фузией, инфиксами и прочими штучками письменный вид получится очень труднопробиваемым для не знающего устный вид.
...А вообще, для начала должен задать вопрос: язык иѳкуиль вы уже выучили, или как? Он, впрочем, не создан специально для непонятности, но... надо же иметь какую-то отправную точку :)
Цитата: Wolliger Mensch от сентября 1, 2013, 22:19
К сожалению, вы опоздали. :'(
Не беда, я же не настаиваю.
Цитата: Unicum от сентября 1, 2013, 22:04
А если наоборот: придумать язык для какой-то тайной организации...
А что ж не пофантазировать. Это будет оправдано, если только единственной целью этой тайной организации будет как раз изучение вот этого конланга. Если у неё будет какая-либо другая цель, то она достигнута не будет: вся умственная энергия, время, да и большая часть матсредств уйдёт на разработку и изучение этого вашего конланга, да ещё на достижение беглости (иначе на тайных собраниях этой тайной организации придётся задействовать синхронных переводчиков). Ну разве что можно попробовать, если только достижение основной цели будет намечено на срок так лет в 30-40 как минимум (захотят ли создатели этой тайной организации этого?); но представьте, сколько тайных агентов спецслужб можно внедрить в эту тайную организацию за такой срок, которые изучат этот конланг не хуже других и сдадут с потрохами все тайные планы вместе с их тайными разработчиками; и весь труд многих лет - насмарку!
Читая про майя, как то письмо придумал:(вернее срисовывал их иероглифы)
по принципу арабского у каждой буквы 3 начертания нач., ср., кон.
смотрелось ничего так, для каждого слова получался свой иероглиф
Цитата: IarannT от сентября 1, 2013, 22:28
Читая про майя, как то письмо придумал:(вернее срисовывал их иероглифы)
по принципу арабского у каждой буквы 3 начертания нач., ср., кон.
смотрелось ничего так, для каждого слова получался свой иероглиф
Какая злая рыбина у вас получилась. Гм.
Это не рыба, это голова Гади Петровича Хреновой.
Mercurio, сколько лет сколько зим! Как дела? Чья голова?
Цитата: Unicum от сентября 1, 2013, 22:04
А если наоборот: придумать язык для какой-то тайной организации или просто для отдельной группы людей, а для посторонних он будет совершенно непонятным?
Уже проделано ИРЛ Вашим покорным слугом и его ближайшим кругом. :yes:
Цитата: IarannT от сентября 1, 2013, 22:40
Mercurio, сколько лет сколько зим! Как дела? Чья голова?
Спасибо, в порядке. Как сами? Гадя Петрович Хренóва - персонаж из КВН, исполненный Михаилом Галустяном. У меня возникла именно такая ассоциация. :)
А, хорошо, Галустян то не обидется, главное чтоб еще кого либо не напоминало. :)
Путешествие по карте языков мира, Леонтьева. Тоненькая (поэтому единственная прочтенная мной книга) там несколько интересных особенностей языков расписано. Можно конланг придумать
Цитата: IarannT от сентября 1, 2013, 22:46
А, хорошо, Галустян то не обидется, главное чтоб еще кого либо не напоминало. :)
Больше вроде никого не напоминает. А так, иероглифы неплохие ;up:
Цитата: IarannT от сентября 1, 2013, 22:46
Путешествие по карте языков мира, Леонтьева. Тоненькая (поэтому единственная прочтенная мной книга) там несколько интересных особенностей языков расписано. Можно конланг придумать
интересно :)
Ероглифы и падежи - не совместимы!
Цитата: Валентин Н от сентября 1, 2013, 23:30
Ероглифы и падежи - не совместимы!
Прекрасно совместимы. Хоть русские, хоть тюркские, хоть финские падежи можно прекрасно записывать иероглифами. Каждому падежу свой иероглиф. А как это произносится - носители знают.
Цитата: Unicum от сентября 1, 2013, 22:04
Вот так: язык непохожий ни на 1 другой, письмо иероглифическое (но не китайские иероглифы, а новое письмо, которое ещё надо придумать). Может для полного счастья ещё и грамматику покруче чем в табасаранском языке (там 48 падежей, а ведь можно и больше), самые разнообразные мыслимые и немыслимые звуки (может, даже издаваемые не только ртом), 3 степени долготы, 10 тонов?
Не то?
(wiki/ru) Ифкуиль (http://ru.wikipedia.org/wiki/%D0%98%D1%84%D0%BA%D1%83%D0%B8%D0%BB%D1%8C)
Ithkuil (2004)
иероглифы+96 падежей+82 фонемы
Цитата: Валентин Н от сентября 1, 2013, 23:30Ероглифы и падежи - не совместимы!
Японский и хеттский негодуэ.
Цитата: Sirko от сентября 2, 2013, 00:16
иероглифы+96 падежей+82 фонемы
Это не совсем иероглифы.
Нерасшифробность решается просто:
1. Берётся любой живой язык с небольшим число фонем, нп. испанский.
2. Для каждой фонемы добавляются взаимонепохожие произносительные варианты. Нп. бывущую испанскую фонему "t" впредь обслуживают звуки ʑ, dʑ͡, ʄ. x̜ʷ. Эти звуки пользятся в одном слове по желанию -- хочу так; хочу сяк. Звук же t впредь обслуживает другую фонему. Аналогично меняютя "сдвигаются" звуки для остальных испанских фонем.
3. Для каждой фонемы (не звука) добавляются варианты совершенно непожожих бука (т. е. число букв превысит число фонем в несколько раз). Буквы для фонемы при письме выбираются произвольно. А буква t впредь обслуживает не фонему t, а другую. Аналогично -- остальные буквы.
4. Паузы/пробелы тоже обозначаются несколькими вариантами букв/звуков. Выбор тоже произволен.
Итог: без ключа никакой часторный анализ не поможет ни устной, ни письменной расшифровке даже при знании, что сие испанский.
Цитата: Unicum от сентября 1, 2013, 22:04
Искусственные языки обычно простые, лёгкие для изучения (ну, волапюк вроде не очень простой язык), да и предназначены для возможно большего количества людей, а то и для всего мира. А если наоборот: придумать язык для какой-то тайной организации или просто для отдельной группы людей, а для посторонних он будет совершенно непонятным? Вот так: язык непохожий ни на 1 другой, письмо иероглифическое (но не китайские иероглифы, а новое письмо, которое ещё надо придумать). Может для полного счастья ещё и грамматику покруче чем в табасаранском языке (там 48 падежей, а ведь можно и больше), самые разнообразные мыслимые и немыслимые звуки (может, даже издаваемые не только ртом), 3 степени долготы, 10 тонов? Думаю, достаточно первых 2 сложностей (изолят и иероглифическое письмо). Ну да, что устный язык, что письменный - хрен поймёшь, всё равно что инопланетный. В процессе обучения как вспомогательное можно использовать какое-то специально придуманное буквенное письмо (чтобы чужие уж никак не смогли изучить этот язык).
Можно придумать и язык, и письмо для него (уж сколько времени это займёт?), но насколько востребован будет этот язык? Так что пока только идея, но всё равно можно обсудить.
Повторно рекомендую Ифкуиль с его письменностью. В крайнем случае дополнительное шифрование RSA/AES и прочая.
Цитата: tempuser от сентября 2, 2013, 11:24
Повторно рекомендую Ифкуиль с его письменностью
Уже третий раз, между прочим. Первый раз автор темы был послан к ифкуилю через 15 минут после создания темы :)
Цитата: Букволюб от сентября 2, 2013, 11:20
Нерасшифробность решается просто:
Цитата: Букволюб от сентября 2, 2013, 11:20
Итог: без ключа никакой часторный анализ не поможет ни устной, ни письменной расшифровке даже при знании, что сие испанский.
Вы слишком самонадеянны в этом отношении. Всё, что вы сделали, с точки зрения анализа - это случайным образом заменили каждую букву текста на что-то из соответствующего букве множества символов. На отдельно взятом коротком тексте это, конечно, поможет. На достаточно длинном - расколется. Вы, видимо, забываете, что приличный частотный анализ работает не только с частотами самих по себе букв(символов), а и с частотами их сочетаний. Не говоря уж о возможностях элементов простого перебора в алгоритме анализа.
Какъ вамъ сей варіантъ
Цитата: NikolaoDen от сентября 1, 2013, 22:17
Бралъ случайную комбинацію звуковъ и придумывалъ ей значеніе. Алфавитъ былъ греческій, но съ измѣнёнными значеніями многихъ буквъ.).
?
Цитата: Toman от сентября 2, 2013, 15:25приличный частотный анализ работает не только с частотами самих по себе букв(символов), а и с частотами их сочетаний. Не говоря уж о возможностях элементов простого перебора в алгоритме анализа.
Теоретически и обезьяна, стуча по клавишам, однажды напишет сонет.
Но!
Если фонемы заменяются вариантами хаотично, и имеют к тому ж не одинаковое их число (нп. фонема t - 4, c -11, пробел - 5), а дешифровщик этого не знает, то какой же длины должен быть текст? С Библию? Или больше?
Впрочем, без математических выкладок спорить нет смысла.
Кстати, можно заменять не только на буквы но и сочетания, но сочетания не обязаны идти рядом, например Ш можно заменить на S_H: машина => маsиhна, это ещё усложнит.
Цитата: Букволюб от сентября 2, 2013, 17:28
Если фонемы заменяются вариантами хаотично
, то это как раз даёт взломщику большое преимущество в смысле простоты алгоритма поиска :)
Цитата: Букволюб от сентября 2, 2013, 17:28
и имеют к тому ж не одинаковое их число (нп. фонема t - 4, c -11, пробел - 5)
Это не играет существенной роли. Хотя, конечно, в целом чем больше числа, тем длиннее должен быть текст. Заранее эти числа взломщику знать не нужно.
Цитата: Букволюб от сентября 2, 2013, 17:28
Впрочем, без математических выкладок спорить нет смысла.
Взломы шифров на неизвестных заранее алгоритмах не делаются полностью автоматизированно (по крайней мере пока не создан почти полноценный ИИ). Тем не менее, это не значит, что они вообще более трудно взламываемы, чем качественные стандартные шифры. Это значит, что, если взлом вашего шифра требует участия человека, то это во-первых даст вам (однократно, разумеется) определённое преимущество во времени, пока человек будет "раскачиваться" и работать, во-вторых, вообще начнут ваш шифр взламывать будут только в случае, если вы уже чем-то достаточно привлекли внимание к себе, чтобы оплатить ручную работу специалиста (а не просто в рутинной процедуре полностью машинного вскрытия всего проходящего стандартно-зашифрованного трафика, к примеру).
Цитата: Букволюб от сентября 2, 2013, 11:20
Нерасшифробность решается просто:
1. Берётся любой живой язык с небольшим число фонем, нп. испанский.
2. Для каждой фонемы добавляются взаимонепохожие произносительные варианты. Нп. бывущую испанскую фонему "t" впредь обслуживают звуки ʑ, dʑ͡, ʄ. x̜ʷ. Эти звуки пользятся в одном слове по желанию -- хочу так; хочу сяк. Звук же t впредь обслуживает другую фонему. Аналогично меняютя "сдвигаются" звуки для остальных испанских фонем.
3. Для каждой фонемы (не звука) добавляются варианты совершенно непожожих бука (т. е. число букв превысит число фонем в несколько раз). Буквы для фонемы при письме выбираются произвольно. А буква t впредь обслуживает не фонему t, а другую. Аналогично -- остальные буквы.
4. Паузы/пробелы тоже обозначаются несколькими вариантами букв/звуков. Выбор тоже произволен.
Итог: без ключа никакой часторный анализ не поможет ни устной, ни письменной расшифровке даже при знании, что сие испанский.
Вы, наверное, агент спецслужб, который хочет привести тайную организацию к краху?
Будем считать, что мы накопили достаточно много материала, а не располагаем одной-двумя фразами. Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно? Теперь криптоаналитик считает все это одной буквой. Первый барьер пройден.
Что вы имеете в виду в третьем пункте, я не совсем понял, но предполагаю, что это то же самое, что и во втором, но в отношении букв. В этом случае усложнение непринципиальное и решается анализом немного большего текста. То же самое касается и пробелов.
Даже если криптоаналитик не будет знать, что это испанский, ваш шифроязык не продержится больше, чем совершенно незашифрованный язык какой-нибудь дагестанской деревни.
Цитата: quez от сентября 2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?
А если не произвольно? Если частотность замен будет разной?
Цитата: Валентин Н от сентября 2, 2013, 20:26А если не произвольно? Если частотность замен будет разной?
Тогда получится слишком много букв с малой частотностью, что заставит заподозрить в них комплементы бо[b]́[/b]льшечастотных.
Цитата: Bhudh от сентября 2, 2013, 20:30
Тогда получится слишком много букв с малой частотностью,
не вычислите уже что к чему относится, темболее если будут разнесённые сочетания.
Цитата: Валентин Н от сентября 2, 2013, 20:26
Цитата: quez от сентября 2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?
А если не произвольно? Если частотность замен будет разной?
Насколько разная? Если одна буква будет иметь подавляющее преимущество, то криптоаналитик будет строить предположения только по отношению к ней. Сравнив ее частоту с частотой буквы испанского, он тут же их отождествит.
Если же частота не сильно меняется, то это мало изменит вышеприведенную схему. Отличие будет состоять в том, что буквам с низкой частотой не удастся сразу найти соответствие.
Цитата: Валентин Н от сентября 2, 2013, 20:31
Цитата: Bhudh от сентября 2, 2013, 20:30
Тогда получится слишком много букв с малой частотностью,
не вычислите уже что к чему относится, темболее если будут разнесённые сочетания.
Никто и не вычисляет низкочастотные буквы, их расставляют по контексту.
Цитата: Валентин Н от сентября 2, 2013, 20:31
не вычислите уже что к чему относится, темболее если будут разнесённые сочетания.
Разнесённые сочетания в несколько увеличивают требуемый объём вычислительной работы (в словаре придётся тестировать не только буквы и слитные сочетания, но и разнесённые). Но, НЯП, не необходимую для взлома величину текста. И не требуют принципиальных изменений алгоритма поиска.
Цитата: Валентин Н от сентября 2, 2013, 19:03Кстати, можно заменять не только на буквы но и сочетания, но сочетания не обязаны идти рядом, например Ш можно заменить на S_H: машина => маsиhна, это ещё усложнит.
Если S, H не задействованы как отдельные фонемы, то можно.
Цитата: Валентин Н от сентября 2, 2013, 20:26
Цитата: quez от сентября 2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?
А если не произвольно? Если частотность замен будет разной?
Именно! Частотность может быть одинаковой лишь при тупо машинном наборе. При личностном всегда будут предпочтения вариантов.
Но можно также сделать число графичесих вариантов каждой фонемы обратно пропорционально ея частотности. Нп.
t при 3% частоте имеет 2 варианта, а
q при 1% -- 6 вариантов. Тогда средние частоты всех графем будут сопоставимы. Нп. при ста графемах, каждая в разных текстах встречается с частототй 0,9-1,1%. Частотный анализ отдыхает.
Не говорю, что язык совсем не расшифробен, но для этого нужно собрать переписку/разговоры за тыщу лет, что делает работу бессмысленною.
Пробел и орфографо-значки тоже считаются "фонемами" с соответными частотностями.
Цитата: Unicum от сентября 1, 2013, 22:04
А если наоборот: придумать язык для какой-то тайной организации или просто для отдельной группы людей, а для посторонних он будет совершенно непонятным?
Дежавю же (http://lingvoforum.net/index.php/topic,4130.0.html) - вдруг, пригодится :tss:
Цитата: Unicum от сентября 1, 2013, 22:04
Искусственные языки обычно простые, лёгкие для изучения (ну, волапюк вроде не очень простой язык), да и предназначены для возможно большего количества людей, а то и для всего мира. А если наоборот: придумать язык для какой-то тайной организации или просто для отдельной группы людей, а для посторонних он будет совершенно непонятным? Вот так: язык непохожий ни на 1 другой, письмо иероглифическое (но не китайские иероглифы, а новое письмо, которое ещё надо придумать).
Для тайной организации нужны не языки-изоляты, для них нужны языки типа
pig latin — производные от существующих на основе каких-то тайных соответствий.
Цитата: Букволюб от сентября 3, 2013, 06:01
Цитата: Валентин Н от сентября 2, 2013, 19:03Кстати, можно заменять не только на буквы но и сочетания, но сочетания не обязаны идти рядом, например Ш можно заменить на S_H: машина => маsиhна, это ещё усложнит.
Если S, H не задействованы как отдельные фонемы, то можно.
Цитата: Валентин Н от сентября 2, 2013, 20:26
Цитата: quez от сентября 2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?
А если не произвольно? Если частотность замен будет разной?
Именно! Частотность может быть одинаковой лишь при тупо машинном наборе. При личностном всегда будут предпочтения вариантов.
Но можно также сделать число графичесих вариантов каждой фонемы обратно пропорционально ея частотности. Нп. t при 3% частоте имеет 2 варианта, а q при 1% -- 6 вариантов. Тогда средние частоты всех графем будут сопоставимы. Нп. при ста графемах, каждая в разных текстах встречается с частототй 0,9-1,1%. Частотный анализ отдыхает.
Не говорю, что язык совсем не расшифробен, но для этого нужно собрать переписку/разговоры за тыщу лет, что делает работу бессмысленною.
Давайте так. Положим, в конце концов, что в приведенном вами выше примере t может обозначаться восемью буквами — четыре звука, на каждый по две буквы. Дайте ответ на два вопроса:
1. Предпочтение одной буквы другой зависит от личности автора текста или оно жестко задано?
2. Если частоты заданы, можете написать, как часто вы предполагаете используете каждую букву?
Эммм... а меня одного тут волнует, что топик-стартер куда-то подевался прямо на старте? ;)
Цитата: Jumis от сентября 3, 2013, 13:21
Эммм... а меня одного тут волнует, что топик-стартер куда-то подевался прямо на старте? ;)
Он просто из тех кто редко постит.
Цитата: Nevik Xukxo от сентября 3, 2013, 13:26
Он просто из тех кто редко постит.
Молчаливый читатель.
Цитата: quez от сентября 3, 2013, 13:13
Положим, в конце концов, что в приведенном вами выше примере t может обозначаться восемью буквами — четыре звука, на каждый по две буквы.
Нет, я изначально подвидел, что любой звук из фонемного набора обозначается любой буквой из фонемного набора.
Цитировать1. Предпочтение одной буквы другой зависит от личности автора текста или оно жестко задано?
Для практической нерасшифробности считаю достаточным личностное предпочтение. Но если нужна и теоретическая неасшифробность, то можно задать одинаковую частотность каждой графемы.
Цитировать2. Если частоты заданы, можете написать, как часто вы предполагаете используете каждую букву?
Частоты чего именно?
Цитата: Букволюб от сентября 3, 2013, 14:05
Нет, я изначально подвидел, что любой звук из фонемного набора обозначается любой буквой из фонемного набора.
Это неважно. Все равно настоящий звук обозначается примерно восемью ненастоящими буквами.
Цитата: Букволюб от сентября 3, 2013, 14:05
Для практической нерасшифробности считаю достаточным личностное предпочтение. Но если нужна и теоретическая неасшифробность, то можно задать одинаковую частотность каждой графемы.
Личные предпочтения в каждого разные, так что на большом количестве текстов частота будет одинаковой, что является ключом к расшифровке. Я удивлен тем, что вы считаете, что одинаковая частотность является преимуществом.
Помоему тут всё просто.
У частотных букв дожно быть больше вариантов замен.
Например за основу берём самый редкий символ Ъ и заменяем его одним символом, для всех остальных, число символов подбирается кратно.
Если П в 146 раз частотнее Ъ, то и заменителей будет 146.
Сталбыть у всех символов будет одинаковая частотность.
Если ошибаюсь - поправьте!
Цитата: Валентин Н от сентября 3, 2013, 15:12
Помоему тут всё просто.
У частотных букв дожно быть больше вариантов замен.
Например за основу берём самый редкий символ Ъ и заменяем его одним символом, для всех остальных, число символов подбирается кратно.
Если П в 146 раз частотнее Ъ, то и заменителей будет 146.
Сталбыть у всех символов будет одинаковая частотность.
Если ошибаюсь - поправьте!
Хорошая попытка. Теперь частотный анализ неприменим. Но мне кажется, что выделить самые частые слова не составит труда. Да и символов не настолько много (тех, которые можно набрать без особого труда.)
Кстати, можно добавить ничего не значих символов чтобы разбавить.
Цитата: quez от сентября 3, 2013, 15:29
Да и символов не настолько много (тех, которые можно набрать без особого труда.)
Надо пользовать транслитератор :umnik:
Здесь у мя опечатка:
Цитата: Букволюб от сентября 3, 2013, 06:01
Нп. t при 3% частоте имеет 2 варианта, а q при 1% -- 6 вариантов. Тогда средние частоты всех графем будут сопоставимы.
Цифры местами перепутал.
Цитата: Валентин Н от сентября 3, 2013, 15:12
Если П в 146 раз частотнее Ъ, то и заменителей будет 146.
Сталбыть у всех символов будет одинаковая частотность.
Если ошибаюсь - поправьте!
Но вы поняли всё правильно.
ЦитироватьКстати, можно добавить ничего не значих символов чтобы разбавить.
Если графем-фальшивок будет достаточно, то и дубликаты фонем не нужны. Но скорость письма снизится.
Цитата: Jumis от сентября 3, 2013, 13:21
Эммм... а меня одного тут волнует, что топик-стартер куда-то подевался прямо на старте? ;)
Он, видимо, заметил, что тема о конланге-изоляте плавно трансформировалась в мирную беседу трёх шифровальщиков...
Цитата: Букволюб от сентября 3, 2013, 15:52
Здесь у мя опечатка:Цитата: Букволюб от сентября 3, 2013, 06:01
Нп. t при 3% частоте имеет 2 варианта, а q при 1% -- 6 вариантов. Тогда средние частоты всех графем будут сопоставимы.
Цифры местами перепутал.
Цитата: Валентин Н от сентября 3, 2013, 15:12
Если П в 146 раз частотнее Ъ, то и заменителей будет 146.
Сталбыть у всех символов будет одинаковая частотность.
Если ошибаюсь - поправьте!
Но вы поняли всё правильно.
ЦитироватьКстати, можно добавить ничего не значих символов чтобы разбавить.
Если графем-фальшивок будет достаточно, то и дубликаты фонем не нужны. Но скорость письма снизится.
Теперь я понял вашу идею. Это достаточно сильный шифр. Но, как я уже говорил, при сильном желании его можно раскусить.
Цитата: quez от сентября 3, 2013, 14:13
Я удивлен тем, что вы считаете, что одинаковая частотность является преимуществом.
:+1: Причём главное даже не одинаковая частотность, а независимость её от контекста. Это позволяет легко сличить паттерны встречаемости по контекстам, и тем самым автоматически раскидать все варианты по означаемым символам. Гораздо сильнее затруднит расшифровку как раз наличие зависимости вероятности применения вариантов от контекста.
Цитата: quez от сентября 3, 2013, 15:29
Цитата: Валентин Н от сентября 3, 2013, 15:12Помоему тут всё просто.
У частотных букв дожно быть больше вариантов замен.
Например за основу берём самый редкий символ Ъ и заменяем его одним символом, для всех остальных, число символов подбирается кратно.
Если П в 146 раз частотнее Ъ, то и заменителей будет 146.
Сталбыть у всех символов будет одинаковая частотность.
Если ошибаюсь - поправьте!
Хорошая попытка. Теперь частотный анализ неприменим. Но мне кажется, что выделить самые частые слова не составит труда.
Нет, в такой ситуации в лоб выделять частые слова - тупиковый вариант. Но я уже с самого начала говорил, что частотный анализ работает не только с частотой встречаемости отдельных букв - он может работать и со словарями подстрок некой разумной длины. Я в своё время писал по работе такие программульки, которые делали подобные словари из геномов бактериофагов, с тем, чтобы потом вычислять ответы на вопросы типа "каково соотношение между такой-то подстрокой и всеми возможными подстроками, которые можно получить из первой одной точечной заменой", "насколько отклоняется фактическая встречаемость такой-то подстроки от встречаемости, предсказываемой для неё исходя из словаря более коротких подстрок" и т.п. Подобная работа в принципе позволяет найти (в тексте на человеческом языке) синонимические символы или сочетания - как раз при условии, что их выбор не зависит от контекста.
Цитата: Букволюб от сентября 3, 2013, 15:52
Если графем-фальшивок будет достаточно, то и дубликаты фонем не нужны.
Но чтобы это сработало, надо строго выдерживать разнообразную частотность среди фальшивок, имитирующую разброс частотности реальных букв, и расположенную в той же области значений. Более того, надо также выдерживать отдельно заданную частотность хотя бы коротких (2-4-буквенных) подстрок из фальшивок и сочетаний фальшивок с реальными буквами. Ну и много других тонкостей, которые так заранее и не скажешь, но которые могут довольно легко всплыть при анализе.
Я читалъ всѣ ваши замѣчанія и подумалъ, что вы слишкомъ всё усложняете. Вотъ шифръ, составленный мною утромъ за пару минутъ.
Цитироватьfådünęjůhöcätujůibakïfyůfådütŕhyjůqëðutybøqë
Посмотримъ, сможете-ли вы его дешифровать? Я-же потомъ напишу вамъ ключъ, ежели не справитесь.
P.S. Всё геніальное - просто.
Цитата: NikolaoDen от сентября 5, 2013, 12:53
Я читалъ всѣ ваши замѣчанія и подумалъ, что вы слишкомъ всё усложняете. Вотъ шифръ, составленный мною утромъ за пару минутъ.
Цитироватьfådünęjůhöcätujůibakïfyůfådütŕhyjůqëðutybøqë
Посмотримъ, сможете-ли вы его дешифровать? Я-же потомъ напишу вамъ ключъ, ежели не справитесь.
P.S. Всё геніальное - просто.
Так не пойдет. Нужен длинный текст. И знание исходного языка тоже не помешает.
Но уже можно сказать, что гласные практически везде чередуются с согласными.
jů встречается подозрительно часто для такого короткого текста.
Исходный языкъ - русскій (въ орѳографіи 1956 года).
Текстъ по длиннѣе:
Цитироватьgøhāfådübȋnętŕkáb1b2lbyfůnbbəjůhjybèkbācåmȧdüvfůcėnfåƕfə
gıjůpætāvfåcȧnfåƕşicnfåkūbhfåcibhɨzněmcıƶaddtühə
læjůcţahcājůplɨfůkgøthdeþgbhfůvblebpytcrjkmrbəvfůcnfůƕ
r3lbyfůcnbbgthdsqchtlbhfādysəcnfȏkvjyfáhəjv
njulfætajhvbhetncztubgtncrfězujcelfåhcndtyyjcnm
düjdühţəvtyf4lbyfåcnbbǫbltzujcelfåhĉundfåljcnbukffĕgjutz
Дамъ небольшую подсказку: предложенія отдѣлены другъ отъ друга пробѣломъ.
Цитата: NikolaoDen от сентября 5, 2013, 14:58
gøhāfådübȋnętŕkáb1b2lbyfůnbbəjůhjybèkbācåmȧdüvfůcėnfåƕfə
gıjůpætāvfåcȧnfåƕşicnfåkūbhfåcibhɨzněmcıƶaddtühə
læjůcţahcājůplɨfůkgøthdeþgbhfůvblebpytcrjkmrbəvfůcnfůƕ
r3lbyfůcnbbgthdsqchtlbhfādysəcnfȏkvjyfáhəjv
njulfætajhvbhetncztubgtncrfězujcelfåhcndtyyjcnm
düjdühţəvtyf4lbyfåcnbbǫbltzujcelfåhĉundfåljcnbukffĕgjutz
(http://smiles.dolf.ru/dolf_ru_1019.gif)
Цитата: NikolaoDen от сентября 5, 2013, 14:58
Исходный языкъ - русскій (въ орѳографіи 1956 года).
Текстъ по длиннѣе:
Цитироватьgøhāfådübȋnętŕkáb1b2lbyfůnbbəjůhjybèkbācåmȧdüvfůcėnfåƕfə
gıjůpætāvfåcȧnfåƕşicnfåkūbhfåcibhɨzněmcıƶaddtühə
læjůcţahcājůplɨfůkgøthdeþgbhfůvblebpytcrjkmrbəvfůcnfůƕ
r3lbyfůcnbbgthdsqchtlbhfādysəcnfȏkvjyfáhəjv
njulfætajhvbhetncztubgtncrfězujcelfåhcndtyyjcnm
düjdühţəvtyf4lbyfåcnbbǫbltzujcelfåhĉundfåljcnbukffĕgjutz
Дамъ небольшую подсказку: предложенія отдѣлены другъ отъ друга пробѣломъ.
Выглядит интересно, но нет достаточно времени, чтобы пробовать раскусить. Тем не менее, сделаю предположение, что få, dü, jů — гласные
Ёку сфупку лимифуюклуи, ю м чути... Тыт кытуи вуцлу шетыкь... Щукю быговты сушке огыныпь :)
Цитата: quez от сентября 5, 2013, 15:48
Выглядит интересно, но нет достаточно времени, чтобы пробовать раскусить. Тем не менее, сделаю предположение, что få, dü, jů — гласные
Близко.
Цитата: NikolaoDen от сентября 1, 2013, 22:17
Интересная тема. Если-бы не усиленная работа надъ Венедчиной въ парѣ съ неуогомоннымъ полякомъ, я-бы тоже подключился (какъ-то и самъ нечто подобное придумывалъ: бралъ случайную комбинацію звуковъ и придумывалъ ей значеніе. Алфавитъ былъ греческій, но съ измѣнёнными значеніями многихъ буквъ.).
А что, можно создать вместе Мне одному создать целый язык со всей лексикой, со всеми иероглифами - не хватит времени. Ну, о невероятной сложности (в самом первом сообщении) - это так, шутка. Грамматика предвидится очень простой. Падежей нет. Родов тоже нет. Ну, слова "мужчина", "женщина", "мальчик", "девочка", а также названия животных разного пола есть, но отдельных личных местоимений "он", "она" нет. О строении слов. В начале слова - корень, в сложных словах может быть 2 корня. Приставок нет, но есть большое количество суффиксов, обозначающих всё что угодно. Существительные заканчиваются согласным или гласным "а", прилагательные и порядочные числительные - гласным "о", наречия - гласным "у", глаголы неопределённой формы - "э", настоящего времени - "эй", прошедшего времени - "энь", будущего времени - "эль". Окончание множественного числа - "и", это число есть только у существительных и личных местоимений.
Ударение особой роли не играет, произносить как удобно (в именах, названиях всё-таки имеет определённое место).
Обычный порядок слов в предложениях: существительное или личное местоимение (подлежащее) - предлагательное - числительное (хоть количественное, хоть порядочное) - глагол - существительное или личное местоимение (дополнение) - наречие, допускаются небольшие отклонения. Предложения всегда простые.
И самое интересное - письмо. Оно смешанное, иероглифическо-буквенное. Иероглифами записываются корни слов, суффиксы - тоже чем-то типа иероглифов (иногда буквами), окончания - буквами, окончание "и" множественного числа - точкой в конце слова. Также буквами записываются имена и названия. Все иероглифы и буквы в словах пишутся слитно, форма иероглифов и букв может немножко изменяться (чтобы красивее выглядело), буквы могут образовывать что-то типа лигатур. Нет никаких знаков препинания, между словами - небольшие пробелы, между предложениями - пробелы побольше. Смотрите вложение.
А что, если у ученых будет неограниченное количество текстов на абсолютно левом языке, то они непременно его расшифруют?
Допустим, у меня есть конланг с хорошей, латинской, фонетической письменностью. И огромное количество осмысленных текстов на нем. И я предлагаю 1000000000000000000 $ тому, кто его переведет.
Переведут?
С шумерского и без латинской письменности переводят. А он, сцуко, изолят.
Цитата: Bhudh от ноября 23, 2021, 22:57
С шумерского и без латинской письменности переводят. А он, сцуко, изолят.
Но там картинки были, контекст понятен. Какие-то вроде переводы на персидский.
Но, в самом деле, я думаю это возможно. Например, если расшифровал слово
сидеть, то можешь смело отнести к классу мест те слова, что часто находятся рядом с
сидеть. Короче, большое количество материала и логичность позволяют перевести.
Цитата: maratique от ноября 23, 2021, 23:05Какие-то вроде переводы на персидский.
Бехистунская надпись написана на древнеперсидском, эламском и аккадском.
Шумерские иероглифы там есть, но вот шумерского языка — нет.