Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Конланг-изолят

Автор Unicum, сентября 1, 2013, 22:04

0 Пользователи и 1 гость просматривают эту тему.

Toman

Цитата: tempuser от сентября  2, 2013, 11:24
Повторно рекомендую Ифкуиль с его письменностью
Уже третий раз, между прочим. Первый раз автор темы был послан к ифкуилю через 15 минут после создания темы :)

Цитата: Букволюб от сентября  2, 2013, 11:20
Нерасшифробность решается просто:
Цитата: Букволюб от сентября  2, 2013, 11:20
Итог: без ключа никакой часторный анализ не поможет ни устной, ни письменной расшифровке даже при знании, что сие испанский.
Вы слишком самонадеянны в этом отношении. Всё, что вы сделали, с точки зрения анализа - это случайным образом заменили каждую букву текста на что-то из соответствующего букве множества символов. На отдельно взятом коротком тексте это, конечно, поможет. На достаточно длинном - расколется. Вы, видимо, забываете, что приличный частотный анализ работает не только с частотами самих по себе букв(символов), а и с частотами их сочетаний. Не говоря уж о возможностях элементов простого перебора в алгоритме анализа.
Во́зле до́ма хо́лм с куля́ми - вы́йду на́ холм, ку́ль поставлю.
В славном городе Miami тётки мерялись ногтями, тик иң озын завсегда у Фиделя борода!

NikolaoDen

Какъ вамъ сей варіантъ
Цитата: NikolaoDen от сентября  1, 2013, 22:17
Бралъ случайную комбинацію звуковъ и придумывалъ ей значеніе. Алфавитъ былъ греческій, но съ измѣнёнными значеніями многихъ буквъ.).
?
Знаю эсперанто, но уже не эсперантистъ.
«Богъ создалъ человѣка бородатымъ». — Патр. Адріанъ.
«Напримѣръ, если вы замѣтили летящій вамъ въ лобъ кирпичъ — это точно къ непріятностямъ». — Lodur.
«Fidelitas termino dierum temptatur».
«Конечно, чѣмъ конь отличается отъ рѣки? Да ничѣмъ по сути, развѣ только ржётъ иногда». — Tibaren.

Букволюб

Цитата: Toman от сентября  2, 2013, 15:25приличный частотный анализ работает не только с частотами самих по себе букв(символов), а и с частотами их сочетаний. Не говоря уж о возможностях элементов простого перебора в алгоритме анализа.
Теоретически и обезьяна, стуча по клавишам, однажды напишет сонет.
Но!
Если фонемы заменяются вариантами хаотично, и имеют к тому ж не одинаковое их число (нп. фонема t - 4,  c -11, пробел - 5), а дешифровщик этого не знает, то какой же длины должен быть текст? С Библию? Или больше?
Впрочем, без математических выкладок спорить нет смысла.
ИГНОР: DarkMax2, Hellerick, LUTS, Pawlo, ValerijS, Wolliger Mensch, edil-jayik

Валентин Н

Кстати, можно заменять не только на буквы но и сочетания, но сочетания не обязаны идти рядом, например Ш можно заменить на S_H: машина => маsиhна, это ещё усложнит.
ЗАБАНИЛ ВИКИПЕДИЮ
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı
Препинания авторские!

Toman

Цитата: Букволюб от сентября  2, 2013, 17:28
Если фонемы заменяются вариантами хаотично
, то это как раз даёт взломщику большое преимущество в смысле простоты алгоритма поиска :)

Цитата: Букволюб от сентября  2, 2013, 17:28
и имеют к тому ж не одинаковое их число (нп. фонема t - 4,  c -11, пробел - 5)
Это не играет существенной роли. Хотя, конечно, в целом чем больше числа, тем длиннее должен быть текст. Заранее эти числа взломщику знать не нужно.

Цитата: Букволюб от сентября  2, 2013, 17:28
Впрочем, без математических выкладок спорить нет смысла.
Взломы шифров на неизвестных заранее алгоритмах не делаются полностью автоматизированно (по крайней мере пока не создан почти полноценный ИИ). Тем не менее, это не значит, что они вообще более трудно взламываемы, чем качественные стандартные шифры. Это значит, что, если взлом вашего шифра требует участия человека, то это во-первых даст вам (однократно, разумеется) определённое преимущество во времени, пока человек будет "раскачиваться" и работать, во-вторых, вообще начнут ваш шифр взламывать будут только в случае, если вы уже чем-то достаточно привлекли внимание к себе, чтобы оплатить ручную работу специалиста (а не просто в рутинной процедуре полностью машинного вскрытия всего проходящего стандартно-зашифрованного трафика, к примеру).
Во́зле до́ма хо́лм с куля́ми - вы́йду на́ холм, ку́ль поставлю.
В славном городе Miami тётки мерялись ногтями, тик иң озын завсегда у Фиделя борода!

quez

Цитата: Букволюб от сентября  2, 2013, 11:20
Нерасшифробность решается просто:

1. Берётся любой живой язык с небольшим число фонем, нп. испанский.
2. Для каждой фонемы добавляются взаимонепохожие произносительные варианты. Нп. бывущую испанскую фонему "t" впредь обслуживают звуки ʑ, dʑ͡, ʄ. x̜ʷ. Эти звуки пользятся в одном слове по желанию -- хочу так; хочу сяк. Звук же t впредь обслуживает другую фонему. Аналогично меняютя "сдвигаются" звуки для остальных испанских фонем.
3. Для каждой фонемы (не звука) добавляются варианты совершенно непожожих бука (т. е. число букв превысит число фонем в несколько раз). Буквы для фонемы при письме выбираются произвольно. А буква t впредь обслуживает не фонему t, а другую. Аналогично -- остальные буквы.
4. Паузы/пробелы тоже обозначаются несколькими вариантами  букв/звуков. Выбор тоже произволен.

Итог: без ключа никакой часторный анализ не поможет ни устной, ни письменной расшифровке даже при знании, что сие испанский.
Вы, наверное, агент спецслужб, который хочет привести тайную организацию к краху?
Будем считать, что мы накопили достаточно много материала, а не располагаем одной-двумя фразами. Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно? Теперь криптоаналитик считает все это одной буквой. Первый барьер пройден.
Что вы имеете в виду в третьем пункте, я не совсем понял, но предполагаю, что это то же самое, что и во втором, но в отношении букв. В этом случае усложнение непринципиальное и решается анализом немного большего текста. То же самое касается и пробелов.

Даже если криптоаналитик не будет знать, что это испанский, ваш шифроязык не продержится больше, чем совершенно незашифрованный язык какой-нибудь дагестанской деревни.

Валентин Н

Цитата: quez от сентября  2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?
А если не произвольно? Если частотность замен будет разной?
ЗАБАНИЛ ВИКИПЕДИЮ
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı
Препинания авторские!

Bhudh

Цитата: Валентин Н от сентября  2, 2013, 20:26А если не произвольно? Если частотность замен будет разной?
Тогда получится слишком много букв с малой частотностью, что заставит заподозрить в них комплементы бо[b]́[/b]льшечастотных.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Валентин Н

Цитата: Bhudh от сентября  2, 2013, 20:30
Тогда получится слишком много букв с малой частотностью,
не вычислите уже что к чему относится, темболее если будут разнесённые сочетания.
ЗАБАНИЛ ВИКИПЕДИЮ
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı
Препинания авторские!

quez

Цитата: Валентин Н от сентября  2, 2013, 20:26
Цитата: quez от сентября  2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?
А если не произвольно? Если частотность замен будет разной?
Насколько разная? Если одна буква будет иметь подавляющее преимущество, то криптоаналитик будет строить предположения только по отношению к ней. Сравнив ее частоту с частотой буквы испанского, он тут же их отождествит.
Если же частота не сильно меняется, то это мало изменит вышеприведенную схему. Отличие будет состоять в том, что буквам с низкой частотой не удастся сразу найти соответствие.

quez

Цитата: Валентин Н от сентября  2, 2013, 20:31
Цитата: Bhudh от сентября  2, 2013, 20:30
Тогда получится слишком много букв с малой частотностью,
не вычислите уже что к чему относится, темболее если будут разнесённые сочетания.
Никто и не вычисляет низкочастотные буквы, их расставляют по контексту.

Toman

Цитата: Валентин Н от сентября  2, 2013, 20:31
не вычислите уже что к чему относится, темболее если будут разнесённые сочетания.
Разнесённые сочетания в несколько увеличивают требуемый объём вычислительной работы (в словаре придётся тестировать не только буквы и слитные сочетания, но и разнесённые). Но, НЯП, не необходимую для взлома величину текста. И не требуют принципиальных изменений алгоритма поиска.
Во́зле до́ма хо́лм с куля́ми - вы́йду на́ холм, ку́ль поставлю.
В славном городе Miami тётки мерялись ногтями, тик иң озын завсегда у Фиделя борода!

Букволюб

Цитата: Валентин Н от сентября  2, 2013, 19:03Кстати, можно заменять не только на буквы но и сочетания, но сочетания не обязаны идти рядом, например Ш можно заменить на S_H: машина => маsиhна, это ещё усложнит.
Если S, H не задействованы как отдельные фонемы, то можно.
Цитата: Валентин Н от сентября  2, 2013, 20:26
Цитата: quez от сентября  2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?
А если не произвольно? Если частотность замен будет разной?
Именно! Частотность может быть одинаковой лишь при тупо машинном наборе. При личностном всегда будут предпочтения вариантов.

Но можно также сделать число графичесих вариантов каждой фонемы обратно пропорционально ея частотности. Нп. t при 3% частоте имеет 2 варианта, а q при 1% -- 6 вариантов. Тогда средние частоты всех графем будут сопоставимы. Нп. при ста графемах, каждая в разных текстах встречается с частототй 0,9-1,1%. Частотный анализ отдыхает.

Не говорю, что язык совсем не расшифробен, но для этого нужно собрать переписку/разговоры за тыщу лет, что делает работу бессмысленною.
ИГНОР: DarkMax2, Hellerick, LUTS, Pawlo, ValerijS, Wolliger Mensch, edil-jayik

Букволюб

Пробел и орфографо-значки тоже считаются "фонемами" с соответными частотностями.
ИГНОР: DarkMax2, Hellerick, LUTS, Pawlo, ValerijS, Wolliger Mensch, edil-jayik

Jumis

Цитата: Unicum от сентября  1, 2013, 22:04
А если наоборот: придумать язык для какой-то тайной организации или просто для отдельной группы людей, а для посторонних он будет совершенно непонятным?

Дежавю же - вдруг, пригодится  :tss:
Ужасный чудными делами
Дзержинец мира искони
Он нашими решил судьбами
Себя прославить в эти дни

Hellerick

Цитата: Unicum от сентября  1, 2013, 22:04
Искусственные языки обычно простые, лёгкие для изучения (ну, волапюк вроде не очень простой язык), да и предназначены для возможно большего количества людей, а то и для всего мира. А если наоборот: придумать язык для какой-то тайной организации или просто для отдельной группы людей, а для посторонних он будет совершенно непонятным? Вот так: язык непохожий ни на 1 другой, письмо иероглифическое (но не китайские иероглифы, а новое письмо, которое ещё надо придумать).

Для тайной организации нужны не языки-изоляты, для них нужны языки типа pig latin — производные от существующих на основе каких-то тайных соответствий.

quez

Цитата: Букволюб от сентября  3, 2013, 06:01
Цитата: Валентин Н от сентября  2, 2013, 19:03Кстати, можно заменять не только на буквы но и сочетания, но сочетания не обязаны идти рядом, например Ш можно заменить на S_H: машина => маsиhна, это ещё усложнит.
Если S, H не задействованы как отдельные фонемы, то можно.
Цитата: Валентин Н от сентября  2, 2013, 20:26
Цитата: quez от сентября  2, 2013, 20:23
Если вы проведете частотный анализ, то увидите, что процент ʑ, dʑ͡, ʄ. x̜ʷ одинаковый — вы же их вставляете произвольно?
А если не произвольно? Если частотность замен будет разной?
Именно! Частотность может быть одинаковой лишь при тупо машинном наборе. При личностном всегда будут предпочтения вариантов.

Но можно также сделать число графичесих вариантов каждой фонемы обратно пропорционально ея частотности. Нп. t при 3% частоте имеет 2 варианта, а q при 1% -- 6 вариантов. Тогда средние частоты всех графем будут сопоставимы. Нп. при ста графемах, каждая в разных текстах встречается с частототй 0,9-1,1%. Частотный анализ отдыхает.

Не говорю, что язык совсем не расшифробен, но для этого нужно собрать переписку/разговоры за тыщу лет, что делает работу бессмысленною.
Давайте так. Положим, в конце концов, что в приведенном вами выше примере t может обозначаться восемью буквами — четыре звука, на каждый по две буквы. Дайте ответ на два вопроса:
1. Предпочтение одной буквы другой зависит от личности автора текста или оно жестко задано?
2. Если частоты заданы, можете написать, как часто вы предполагаете используете каждую букву?

Jumis

Эммм... а меня одного тут волнует, что топик-стартер куда-то подевался прямо на старте? ;)
Ужасный чудными делами
Дзержинец мира искони
Он нашими решил судьбами
Себя прославить в эти дни

Nevik Xukxo

Цитата: Jumis от сентября  3, 2013, 13:21
Эммм... а меня одного тут волнует, что топик-стартер куда-то подевался прямо на старте? ;)

Он просто из тех кто редко постит.

Jumis

Ужасный чудными делами
Дзержинец мира искони
Он нашими решил судьбами
Себя прославить в эти дни

Букволюб

Цитата: quez от сентября  3, 2013, 13:13
Положим, в конце концов, что в приведенном вами выше примере t может обозначаться восемью буквами — четыре звука, на каждый по две буквы.
Нет, я изначально подвидел, что любой звук из фонемного набора обозначается любой буквой из фонемного набора.   

Цитировать1. Предпочтение одной буквы другой зависит от личности автора текста или оно жестко задано?
Для практической нерасшифробности считаю достаточным личностное предпочтение. Но если нужна и теоретическая неасшифробность, то можно задать одинаковую частотность каждой графемы.

Цитировать2. Если частоты заданы, можете написать, как часто вы предполагаете используете каждую букву?
Частоты чего именно?
ИГНОР: DarkMax2, Hellerick, LUTS, Pawlo, ValerijS, Wolliger Mensch, edil-jayik

quez

Цитата: Букволюб от сентября  3, 2013, 14:05
Нет, я изначально подвидел, что любой звук из фонемного набора обозначается любой буквой из фонемного набора.
Это неважно. Все равно настоящий звук обозначается примерно восемью ненастоящими буквами.
Цитата: Букволюб от сентября  3, 2013, 14:05
Для практической нерасшифробности считаю достаточным личностное предпочтение. Но если нужна и теоретическая неасшифробность, то можно задать одинаковую частотность каждой графемы.
Личные предпочтения в каждого разные, так что на большом количестве текстов частота будет одинаковой, что является ключом к расшифровке. Я удивлен тем, что вы считаете, что одинаковая частотность является преимуществом.

Валентин Н

Помоему тут всё просто.
У частотных букв дожно быть больше вариантов замен.
Например за основу берём самый редкий символ Ъ и заменяем его одним символом, для всех остальных, число символов подбирается кратно.
Если П в 146 раз частотнее Ъ, то и заменителей будет 146.
Сталбыть у всех символов будет одинаковая частотность.
Если ошибаюсь - поправьте!
ЗАБАНИЛ ВИКИПЕДИЮ
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı
Препинания авторские!

quez

Цитата: Валентин Н от сентября  3, 2013, 15:12
Помоему тут всё просто.
У частотных букв дожно быть больше вариантов замен.
Например за основу берём самый редкий символ Ъ и заменяем его одним символом, для всех остальных, число символов подбирается кратно.
Если П в 146 раз частотнее Ъ, то и заменителей будет 146.
Сталбыть у всех символов будет одинаковая частотность.
Если ошибаюсь - поправьте!
Хорошая попытка. Теперь частотный анализ неприменим. Но мне кажется, что выделить самые частые слова не составит труда. Да и символов не настолько много (тех, которые можно набрать без особого труда.)

Валентин Н

Кстати, можно добавить ничего не значих символов чтобы разбавить.
ЗАБАНИЛ ВИКИПЕДИЮ
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı
Препинания авторские!

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр