Лингвофорум

Общий раздел => Наука и техника => Компьютеры => Тема начата: Γρηγόριος от июня 28, 2016, 18:33

Название: Дешіффровка.
Отправлено: Γρηγόριος от июня 28, 2016, 18:33
Помогите опрѣдѣлить кодировку сїя страницы (http://www.rovs.narod.ru/vozros.htm).
Название: Дешіффровка.
Отправлено: Bhudh от июня 28, 2016, 18:43
http://lurkmo.re/бНОПНЯ (http://lurkmo.re/%D0%B1%D0%9D%D0%9E%D0%9F%D0%9D%D0%AF)
Название: Дешіффровка.
Отправлено: Upliner от июня 28, 2016, 19:01
Цитата: Γρηγόριος от июня 28, 2016, 18:33
Помогите опрѣдѣлить кодировку сїя страницы (http://www.rovs.narod.ru/vozros.htm).
iconv -ct koi-8 vozros.html | iconv -cf cp1251
Название: Дешіффровка.
Отправлено: Bhudh от июня 28, 2016, 19:09
Цитировать"iconv" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Название: Дешіффровка.
Отправлено: Upliner от июня 28, 2016, 19:48
Цитата: Bhudh от июня 28, 2016, 19:09
Цитировать"iconv" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Переведу с юниксовского на русский: данную веб-страницу надо перекодировать из UTF-8 в KOI-8 и интерпретировать результат как Windows-1251. Штатными средствами браузера это, к сожалению, сделать нельзя. Можно поставить виндовую версию iconv (какую-нибудь нативную сборку либо через cygwin) или графический виндовый перекодировщик и перекодировать страницы этого сайта там. Может кто-то ещё подскажет, как это можно сделать с помощью javascript.
Название: Дешіффровка.
Отправлено: Γρηγόριος от июня 28, 2016, 21:17
Цитата: Upliner от июня 28, 2016, 19:48
Цитата: Bhudh от июня 28, 2016, 19:09
Цитировать"iconv" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Переведу с юниксовского на русский: данную веб-страницу надо перекодировать из UTF-8 в KOI-8 и интерпретировать результат как Windows-1251. Штатными средствами браузера это, к сожалению, сделать нельзя. Можно поставить виндовую версию iconv (какую-нибудь нативную сборку либо через cygwin) или графический виндовый перекодировщик и перекодировать страницы этого сайта там. Может кто-то ещё подскажет, как это можно сделать с помощью javascript.

Въ Google Chrome можно вѣдь кодировку переключить...
Название: Дешіффровка.
Отправлено: Bhudh от июня 28, 2016, 21:30
Цитата: Γρηγόριος от июня 28, 2016, 21:17Въ Google Chrome можно вѣдь кодировку переключить...
Переключение кодировок появилось задолго до Google Chrome и как бы не задолго до Google как такового.
Но тут это не поможет. Кодировка страницы — utf-8. Но текст на ней выглядит так, как будто это кодировка KOI-8, которая неправильно открыта как Windows-1251.
Видимо, глюк генерации FrontPage, все остальные страницы сайта выглядят нормально.
Название: Дешіффровка.
Отправлено: СНовосиба от июля 1, 2016, 19:43
Цитата: Bhudh от июня 28, 2016, 19:09"iconv" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.

http://gnuwin32.sourceforge.net/packages/libiconv.htm
Название: Дешіффровка.
Отправлено: mrshch от июля 3, 2016, 00:24
Никак не могу понять, какая в бнопне закономерность.
В "диакритиках" или "планетах" всё понятно - порядку алфавита соответствует логичный порядок диакритик или планетарных/зодиакальных символов.
А в бнопне вроде бы просто сдвиг на одну букву алфавита назад, но сам "алфавит" получается несколько странным:
АБВЧЮ
ИЙКЛМНОПРТФЖЦГЗЪЯСУХ
ШЫЩЭЬ
и плюс "изоляты" Д и Е, вообще не меняющие значение :donno:
Название: Дешіффровка.
Отправлено: Demetrius от июля 3, 2016, 00:40
Цитата: mrshch от июля  3, 2016, 00:24
А в бнопне вроде бы просто сдвиг на одну букву алфавита назад, но сам "алфавит" получается несколько странным:
АБВЧЮ
ИЙКЛМНОПРТФЖЦГЗЪЯСУХ
ШЫЩЭЬ
и плюс "изоляты" Д и Е, вообще не меняющие значение :donno:
Помедитируйте на табличку ASCII (https://en.wikipedia.org/wiki/ASCII#Code_chart), табличку KOI8-R (https://ru.wikipedia.org/wiki/%D0%9A%D0%9E%D0%98-8#.D0.9A.D0.BE.D0.B4.D0.B8.D1.80.D0.BE.D0.B2.D0.BA.D0.B0_KOI8-R_.28.D1.80.D1.83.D1.81.D1.81.D0.BA.D0.B0.D1.8F.29) и табличку табличку cp1251 (https://ru.wikipedia.org/wiki/Windows-1251#.D0.9A.D0.BE.D0.B4.D0.B8.D1.80.D0.BE.D0.B2.D0.BA.D0.B0_Windows-1251_.28.D1.81.D0.B8.D0.BD.D0.BE.D0.BD.D0.B8.D0.BC_CP1251.29). «бнопня» — это «вопрос», закодированный в cp1251 и прочитанный в КОИ-8.

В КОИ-8 русские буквы выбраны в соответствии с латинскими в ASCII. Так, чтобы если вдруг система обнулила верхний бит (то есть символ с кодом C016 = 110000002 стал символом с кодом 4016 = 10000002 и так далее), текст остался читаемым. То есть при обнулении верхнего бита в «Привет» получился бы «pRIWET». Соответственно, порядок алфавита выбран в соответствии с латиницей: юабцдефгхийклмнопярстужвьызшэщчъ.

Не знаю, почему большие и маленькие буквы поменяны местами, видимо для совместимости с какой-то ранней кодировкой, где не было маленьких букв вообще, а маленькие латинские были заменены большими кириллическими.
Название: Дешіффровка.
Отправлено: mrshch от июля 3, 2016, 02:35
Цитата: Demetrius от июля  3, 2016, 00:40
В КОИ-8 русские буквы выбраны в соответствии с латинскими в ASCII. Так, чтобы если вдруг система обнулила верхний бит (то есть символ с кодом C016 = 110000002 стал символом с кодом 4016 = 10000002 и так далее), текст остался читаемым. То есть при обнулении верхнего бита в «Привет» получился бы «pRIWET». Соответственно, порядок алфавита выбран в соответствии с латиницей: юабцдефгхийклмнопярстужвьызшэщчъ.
Неплохо придумали, но в и ж следовало бы поменять местами, намного легче бы транслит читался.
Название: Дешіффровка.
Отправлено: Python от июля 4, 2016, 05:56
Цитата: Demetrius от июля  3, 2016, 00:40
Цитата: mrshch от июля  3, 2016, 00:24
А в бнопне вроде бы просто сдвиг на одну букву алфавита назад, но сам "алфавит" получается несколько странным:
АБВЧЮ
ИЙКЛМНОПРТФЖЦГЗЪЯСУХ
ШЫЩЭЬ
и плюс "изоляты" Д и Е, вообще не меняющие значение :donno:
Помедитируйте на табличку ASCII (https://en.wikipedia.org/wiki/ASCII#Code_chart), табличку KOI8-R (https://ru.wikipedia.org/wiki/%D0%9A%D0%9E%D0%98-8#.D0.9A.D0.BE.D0.B4.D0.B8.D1.80.D0.BE.D0.B2.D0.BA.D0.B0_KOI8-R_.28.D1.80.D1.83.D1.81.D1.81.D0.BA.D0.B0.D1.8F.29) и табличку табличку cp1251 (https://ru.wikipedia.org/wiki/Windows-1251#.D0.9A.D0.BE.D0.B4.D0.B8.D1.80.D0.BE.D0.B2.D0.BA.D0.B0_Windows-1251_.28.D1.81.D0.B8.D0.BD.D0.BE.D0.BD.D0.B8.D0.BC_CP1251.29). «бнопня» — это «вопрос», закодированный в cp1251 и прочитанный в КОИ-8.

В КОИ-8 русские буквы выбраны в соответствии с латинскими в ASCII. Так, чтобы если вдруг система обнулила верхний бит (то есть символ с кодом C016 = 110000002 стал символом с кодом 4016 = 10000002 и так далее), текст остался читаемым. То есть при обнулении верхнего бита в «Привет» получился бы «pRIWET». Соответственно, порядок алфавита выбран в соответствии с латиницей: юабцдефгхийклмнопярстужвьызшэщчъ.

Не знаю, почему большие и маленькие буквы поменяны местами, видимо для совместимости с какой-то ранней кодировкой, где не было маленьких букв вообще, а маленькие латинские были заменены большими кириллическими.
(wiki/en) KOI-7 (http://en.wikipedia.org/wiki/KOI-7)