Конланг-изолят

Toman · сентября 2, 2013, 15:25

Цитата: tempuser от сентября 2, 2013, 11:24
Повторно рекомендую Ифкуиль с его письменностью

Уже третий раз, между прочим. Первый раз автор темы был послан к ифкуилю через 15 минут после создания темы

Цитата: Букволюб от сентября 2, 2013, 11:20
Нерасшифробность решается просто:

Цитата: Букволюб от сентября 2, 2013, 11:20
Итог: без ключа никакой часторный анализ не поможет ни устной, ни письменной расшифровке даже при знании, что сие испанский.

Вы слишком самонадеянны в этом отношении. Всё, что вы сделали, с точки зрения анализа - это случайным образом заменили каждую букву текста на что-то из соответствующего букве множества символов. На отдельно взятом коротком тексте это, конечно, поможет. На достаточно длинном - расколется. Вы, видимо, забываете, что приличный частотный анализ работает не только с частотами самих по себе букв(символов), а и с частотами их сочетаний. Не говоря уж о возможностях элементов простого перебора в алгоритме анализа.

NikolaoDen · сентября 2, 2013, 16:13

Какъ вамъ сей варіантъ

Цитата: NikolaoDen от сентября 1, 2013, 22:17
Бралъ случайную комбинацію звуковъ и придумывалъ ей значеніе. Алфавитъ былъ греческій, но съ измѣнёнными значеніями многихъ буквъ.).

?

Букволюб · сентября 2, 2013, 17:28

Цитата: Toman от сентября 2, 2013, 15:25приличный частотный анализ работает не только с частотами самих по себе букв(символов), а и с частотами их сочетаний. Не говоря уж о возможностях элементов простого перебора в алгоритме анализа.

Теоретически и обезьяна, стуча по клавишам, однажды напишет сонет.
Но!
Если фонемы заменяются вариантами хаотично, и имеют к тому ж не одинаковое их число (нп. фонема t - 4, c -11, пробел - 5), а дешифровщик этого не знает, то какой же длины должен быть текст? С Библию? Или больше?
Впрочем, без математических выкладок спорить нет смысла.

Валентин Н · сентября 2, 2013, 19:03

Кстати, можно заменять не только на буквы но и сочетания, но сочетания не обязаны идти рядом, например Ш можно заменить на S_H: машина => маsиhна, это ещё усложнит.

Toman · сентября 2, 2013, 19:52

Цитата: Букволюб от сентября 2, 2013, 17:28
Если фонемы заменяются вариантами хаотично

, то это как раз даёт взломщику большое преимущество в смысле простоты алгоритма поиска

Цитата: Букволюб от сентября 2, 2013, 17:28
и имеют к тому ж не одинаковое их число (нп. фонема t - 4, c -11, пробел - 5)

Это не играет существенной роли. Хотя, конечно, в целом чем больше числа, тем длиннее должен быть текст. Заранее эти числа взломщику знать не нужно.

Цитата: Букволюб от сентября 2, 2013, 17:28
Впрочем, без математических выкладок спорить нет смысла.

Взломы шифров на неизвестных заранее алгоритмах не делаются полностью автоматизированно (по крайней мере пока не создан почти полноценный ИИ). Тем не менее, это не значит, что они вообще более трудно взламываемы, чем качественные стандартные шифры. Это значит, что, если взлом вашего шифра требует участия человека, то это во-первых даст вам (однократно, разумеется) определённое преимущество во времени, пока человек будет "раскачиваться" и работать, во-вторых, вообще начнут ваш шифр взламывать будут только в случае, если вы уже чем-то достаточно привлекли внимание к себе, чтобы оплатить ручную работу специалиста (а не просто в рутинной процедуре полностью машинного вскрытия всего проходящего стандартно-зашифрованного трафика, к примеру).

quez · сентября 2, 2013, 20:23

Цитата: Букволюб от сентября 2, 2013, 11:20
Нерасшифробность решается просто:

1. Берётся любой живой язык с небольшим число фонем, нп. испанский.
2. Для каждой фонемы добавляются взаимонепохожие произносительные варианты. Нп. бывущую испанскую фонему "t" впредь обслуживают звуки ʑ, dʑ͡, ʄ. x̜ʷ. Эти звуки пользятся в одном слове по желанию -- хочу так; хочу сяк. Звук же t впредь обслуживает другую фонему. Аналогично меняютя "сдвигаются" звуки для остальных испанских фонем.
3. Для каждой фонемы (не звука) добавляются варианты совершенно непожожих бука (т. е. число букв превысит число фонем в несколько раз). Буквы для фонемы при письме выбираются произвольно. А буква t впредь обслуживает не фонему t, а другую. Аналогично -- остальные буквы.
4. Паузы/пробелы тоже обозначаются несколькими вариантами букв/звуков. Выбор тоже произволен.

Итог: без ключа никакой часторный анализ не поможет ни устной, ни письменной расшифровке даже при знании, что сие испанский.

Вы, наверное, агент спецслужб, который хочет привести тайную организацию к краху?
Будем считать, что мы накопили достаточно много материала, а не располагаем одной-двумя фразами. Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно? Теперь криптоаналитик считает все это одной буквой. Первый барьер пройден.
Что вы имеете в виду в третьем пункте, я не совсем понял, но предполагаю, что это то же самое, что и во втором, но в отношении букв. В этом случае усложнение непринципиальное и решается анализом немного большего текста. То же самое касается и пробелов.

Даже если криптоаналитик не будет знать, что это испанский, ваш шифроязык не продержится больше, чем совершенно незашифрованный язык какой-нибудь дагестанской деревни.

Валентин Н · сентября 2, 2013, 20:26

Цитата: quez от сентября 2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?

А если не произвольно? Если частотность замен будет разной?

Bhudh · сентября 2, 2013, 20:30

Цитата: Валентин Н от сентября 2, 2013, 20:26А если не произвольно? Если частотность замен будет разной?

Тогда получится слишком много букв с малой частотностью, что заставит заподозрить в них комплементы бо[b]́[/b]льшечастотных.

Валентин Н · сентября 2, 2013, 20:31

Цитата: Bhudh от сентября 2, 2013, 20:30
Тогда получится слишком много букв с малой частотностью,

не вычислите уже что к чему относится, темболее если будут разнесённые сочетания.

quez · сентября 2, 2013, 20:38

Цитата: Валентин Н от сентября 2, 2013, 20:26
Цитата: quez от сентября 2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?
А если не произвольно? Если частотность замен будет разной?

Насколько разная? Если одна буква будет иметь подавляющее преимущество, то криптоаналитик будет строить предположения только по отношению к ней. Сравнив ее частоту с частотой буквы испанского, он тут же их отождествит.
Если же частота не сильно меняется, то это мало изменит вышеприведенную схему. Отличие будет состоять в том, что буквам с низкой частотой не удастся сразу найти соответствие.

quez · сентября 2, 2013, 20:41

Цитата: Валентин Н от сентября 2, 2013, 20:31
Цитата: Bhudh от сентября 2, 2013, 20:30
Тогда получится слишком много букв с малой частотностью,
не вычислите уже что к чему относится, темболее если будут разнесённые сочетания.

Никто и не вычисляет низкочастотные буквы, их расставляют по контексту.

Toman · сентября 2, 2013, 21:13

Цитата: Валентин Н от сентября 2, 2013, 20:31
не вычислите уже что к чему относится, темболее если будут разнесённые сочетания.

Разнесённые сочетания в несколько увеличивают требуемый объём вычислительной работы (в словаре придётся тестировать не только буквы и слитные сочетания, но и разнесённые). Но, НЯП, не необходимую для взлома величину текста. И не требуют принципиальных изменений алгоритма поиска.

Букволюб · сентября 3, 2013, 06:01

Цитата: Валентин Н от сентября 2, 2013, 19:03Кстати, можно заменять не только на буквы но и сочетания, но сочетания не обязаны идти рядом, например Ш можно заменить на S_H: машина => маsиhна, это ещё усложнит.

Если S, H не задействованы как отдельные фонемы, то можно.

Цитата: Валентин Н от сентября 2, 2013, 20:26
Цитата: quez от сентября 2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?
А если не произвольно? Если частотность замен будет разной?

Именно! Частотность может быть одинаковой лишь при тупо машинном наборе. При личностном всегда будут предпочтения вариантов.

Но можно также сделать число графичесих вариантов каждой фонемы обратно пропорционально ея частотности. Нп. t при 3% частоте имеет 2 варианта, а q при 1% -- 6 вариантов. Тогда средние частоты всех графем будут сопоставимы. Нп. при ста графемах, каждая в разных текстах встречается с частототй 0,9-1,1%. Частотный анализ отдыхает.

Не говорю, что язык совсем не расшифробен, но для этого нужно собрать переписку/разговоры за тыщу лет, что делает работу бессмысленною.

Букволюб · сентября 3, 2013, 06:19

Пробел и орфографо-значки тоже считаются "фонемами" с соответными частотностями.

Jumis · сентября 3, 2013, 06:52

Цитата: Unicum от сентября 1, 2013, 22:04
А если наоборот: придумать язык для какой-то тайной организации или просто для отдельной группы людей, а для посторонних он будет совершенно непонятным?

Дежавю же - вдруг, пригодится

Hellerick · сентября 3, 2013, 07:36

Цитата: Unicum от сентября 1, 2013, 22:04
Искусственные языки обычно простые, лёгкие для изучения (ну, волапюк вроде не очень простой язык), да и предназначены для возможно большего количества людей, а то и для всего мира. А если наоборот: придумать язык для какой-то тайной организации или просто для отдельной группы людей, а для посторонних он будет совершенно непонятным? Вот так: язык непохожий ни на 1 другой, письмо иероглифическое (но не китайские иероглифы, а новое письмо, которое ещё надо придумать).

Для тайной организации нужны не языки-изоляты, для них нужны языки типа pig latin — производные от существующих на основе каких-то тайных соответствий.

quez · сентября 3, 2013, 13:13

Цитата: Букволюб от сентября 3, 2013, 06:01
Цитата: Валентин Н от сентября 2, 2013, 19:03Кстати, можно заменять не только на буквы но и сочетания, но сочетания не обязаны идти рядом, например Ш можно заменить на S_H: машина => маsиhна, это ещё усложнит.
Если S, H не задействованы как отдельные фонемы, то можно.
Цитата: Валентин Н от сентября 2, 2013, 20:26
Цитата: quez от сентября 2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?
А если не произвольно? Если частотность замен будет разной?
Именно! Частотность может быть одинаковой лишь при тупо машинном наборе. При личностном всегда будут предпочтения вариантов.

Но можно также сделать число графичесих вариантов каждой фонемы обратно пропорционально ея частотности. Нп. t при 3% частоте имеет 2 варианта, а q при 1% -- 6 вариантов. Тогда средние частоты всех графем будут сопоставимы. Нп. при ста графемах, каждая в разных текстах встречается с частототй 0,9-1,1%. Частотный анализ отдыхает.

Не говорю, что язык совсем не расшифробен, но для этого нужно собрать переписку/разговоры за тыщу лет, что делает работу бессмысленною.

Давайте так. Положим, в конце концов, что в приведенном вами выше примере t может обозначаться восемью буквами — четыре звука, на каждый по две буквы. Дайте ответ на два вопроса:
1. Предпочтение одной буквы другой зависит от личности автора текста или оно жестко задано?
2. Если частоты заданы, можете написать, как часто вы предполагаете используете каждую букву?

Jumis · сентября 3, 2013, 13:21

Эммм... а меня одного тут волнует, что топик-стартер куда-то подевался прямо на старте?

Nevik Xukxo · сентября 3, 2013, 13:26

Цитата: Jumis от сентября 3, 2013, 13:21
Эммм... а меня одного тут волнует, что топик-стартер куда-то подевался прямо на старте?

Он просто из тех кто редко постит.

Jumis · сентября 3, 2013, 13:31

Цитата: Nevik Xukxo от сентября 3, 2013, 13:26
Он просто из тех кто редко постит.

Молчаливый читатель.

Букволюб · сентября 3, 2013, 14:05

Цитата: quez от сентября 3, 2013, 13:13
Положим, в конце концов, что в приведенном вами выше примере t может обозначаться восемью буквами — четыре звука, на каждый по две буквы.

Нет, я изначально подвидел, что любой звук из фонемного набора обозначается любой буквой из фонемного набора.

Цитировать1. Предпочтение одной буквы другой зависит от личности автора текста или оно жестко задано?

Для практической нерасшифробности считаю достаточным личностное предпочтение. Но если нужна и теоретическая неасшифробность, то можно задать одинаковую частотность каждой графемы.

Цитировать2. Если частоты заданы, можете написать, как часто вы предполагаете используете каждую букву?

Частоты чего именно?

quez · сентября 3, 2013, 14:13

Цитата: Букволюб от сентября 3, 2013, 14:05
Нет, я изначально подвидел, что любой звук из фонемного набора обозначается любой буквой из фонемного набора.

Это неважно. Все равно настоящий звук обозначается примерно восемью ненастоящими буквами.

Цитата: Букволюб от сентября 3, 2013, 14:05
Для практической нерасшифробности считаю достаточным личностное предпочтение. Но если нужна и теоретическая неасшифробность, то можно задать одинаковую частотность каждой графемы.

Личные предпочтения в каждого разные, так что на большом количестве текстов частота будет одинаковой, что является ключом к расшифровке. Я удивлен тем, что вы считаете, что одинаковая частотность является преимуществом.

Валентин Н · сентября 3, 2013, 15:12

Помоему тут всё просто.
У частотных букв дожно быть больше вариантов замен.
Например за основу берём самый редкий символ Ъ и заменяем его одним символом, для всех остальных, число символов подбирается кратно.
Если П в 146 раз частотнее Ъ, то и заменителей будет 146.
Сталбыть у всех символов будет одинаковая частотность.
Если ошибаюсь - поправьте!

quez · сентября 3, 2013, 15:29

Цитата: Валентин Н от сентября 3, 2013, 15:12
Помоему тут всё просто.
У частотных букв дожно быть больше вариантов замен.
Например за основу берём самый редкий символ Ъ и заменяем его одним символом, для всех остальных, число символов подбирается кратно.
Если П в 146 раз частотнее Ъ, то и заменителей будет 146.
Сталбыть у всех символов будет одинаковая частотность.
Если ошибаюсь - поправьте!

Хорошая попытка. Теперь частотный анализ неприменим. Но мне кажется, что выделить самые частые слова не составит труда. Да и символов не настолько много (тех, которые можно набрать без особого труда.)

Валентин Н · сентября 3, 2013, 15:35

Кстати, можно добавить ничего не значих символов чтобы разбавить.

Лингвофорум

Конланг-изолят

Toman

NikolaoDen

Букволюб

Валентин Н

Toman

quez

Валентин Н

Bhudh

Валентин Н

quez

quez

Toman

Букволюб

Букволюб

Jumis

Hellerick

quez

Jumis

Nevik Xukxo

Jumis

Букволюб

quez

Валентин Н

quez

Валентин Н

Быстрый ответ