Лингвофорум

Теоретический раздел => Прикладная лингвистика => Компьютерная лингвистика => Тема начата: Red Khan от ноября 24, 2020, 19:17

Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 19:17
В общем имеется картинка с иероглифами, её транлитерация и транскрипция и даже построчный перевод на английский.
Хотелось бы иметь эту надпись не как картинку, а как юникодовские символы, сомнительно что для египетских иероглифов есть OCR.

Первая картинка:
(https://i.imgur.com/V8eBvVO.png)
Транслитерация:
iw m-a pA.ii mH n.k! / sSm imn-ra n.n!

Транскрипция:
Iu em-'a paï meh en-ek! / Seshem Amun-Ra en-en!

Прямой перевод:
/be in-hand of-mine be-full of you!/ /may-guide Amun-Ra to-us!/

Вторая:
(https://i.imgur.com/qkium8H.png)
Транслитерация:
iw kmt nhw.ti
ir nn sxn.i s pA.ii mrr sxn.i n Ax.t!

Транскрипция:
Iu Kemet nehuti
Ir nen seheni es paï merer seheni en ahu[t]!

Прямой перевод:
/be Egypt lost/
/if not embrace-I man of-mine who-loves embrace-I to serpent!/

Третья:
(https://i.imgur.com/9pai8xD.png)
Транслитерация:
inwk ist Ἶσις  xpr.ti sp-sn
inwk qliwApAdr{t}A Hna xnmst ir iw.k SAw

Транскрипция:
Inek Iset, Isis, heperti sep-sen
Inek Kliwopatra hena henemeset ir iwek shawu

Прямой перевод:
/I Isis, Isis [на греческом], become twice/
/I Cleopatra with friend if be-you worth/

Я попробовал было сунуться в юникодовскую таблицу символов (https://en.wiktionary.org/wiki/Appendix:Unicode/Egyptian_Hieroglyphs), но если у клинописи есть хотя бы слоги, то тут просто порядковые номера. Может есть какие-то таблицы с соответствие транскрипции?
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 24, 2020, 19:26
Offtop
Мне прям стало интересно, какой софт сейчас поддерживает Egyptian Hieroglyph Format Controls.

Цитата: Red Khan от ноября 24, 2020, 19:17Может есть какие-то таблицы с соответствие транскрипции?
В таблицах на странице синтаксиса WikiHiero (https://www.mediawiki.org/wiki/Extension:WikiHiero/Syntax) те же самые иероглифы в том же (гарднеровском) порядке под теми же номерами.

А на странице фонемных соответствий (https://www.mediawiki.org/wiki/Extension:WikiHiero/phonemes) можно искать их транслитерацию.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 19:32
Цитата: Bhudh от ноября 24, 2020, 19:26
Egyptian Hieroglyph Format Controls
А это что?
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 19:35
Цитата: Bhudh от ноября 24, 2020, 19:26
В таблицах на странице синтаксиса WikiHiero (https://www.mediawiki.org/wiki/Extension:WikiHiero/Syntax) те же самые иероглифы в том же (гарднеровском) порядке под теми же номерами.

А на странице фонемных соответствий (https://www.mediawiki.org/wiki/Extension:WikiHiero/phonemes) можно искать их транслитерацию.
Спасибо, сейчас попробую разобраться.

Я уже в принципе просто перебором нашёл первые два символа с первой картинки - цветущий камыш и цыплёнка перепёлки.
𓇋𓅱
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 19:36
Offtop
Цитата: Red Khan от ноября 24, 2020, 19:35
цветущий камыш и цыплёнка перепёлки
Как тут не вспомнить анекдот про древнего египтянина, которого попросили сказать его имя по буквам. :)
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 24, 2020, 19:37
А это следующий блок (ссылочка справа), который как раз как в WikiHiero указывает расположение отдельных иероглифов в композитах.
Цитата: Egyptian Hieroglyph Format Controls glyphsCode Point   Glyph   Character Name
13430   𓐰   EGYPTIAN HIEROGLYPH VERTICAL JOINER   
13431   𓐱   EGYPTIAN HIEROGLYPH HORIZONTAL JOINER   
13432   𓐲   EGYPTIAN HIEROGLYPH INSERT AT TOP START   
13433   𓐳   EGYPTIAN HIEROGLYPH INSERT AT BOTTOM START   
13434   𓐴   EGYPTIAN HIEROGLYPH INSERT AT TOP END   
13435   𓐵   EGYPTIAN HIEROGLYPH INSERT AT BOTTOM END   
13436   𓐶   EGYPTIAN HIEROGLYPH OVERLAY MIDDLE   
13437   𓐷   EGYPTIAN HIEROGLYPH BEGIN SEGMENT   
13438   𓐸   EGYPTIAN HIEROGLYPH END SEGMENT
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 19:37
Цитата: Bhudh от ноября 24, 2020, 19:37
А это следующий блок (ссылочка справа), который как раз как в WikiHiero указывает расположение отдельных иероглифов в композитах.
Это как в третьем символе на первой картинке? Сова а под ней что-то другое?
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 24, 2020, 19:39
Ыманно. Первый глиф за это и отвечает.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 19:42
Цитата: Bhudh от ноября 24, 2020, 19:39
Ыманно. Первый глиф за это и отвечает.
Хотите сказать что браузера (а мне ведь в конечном итоге для веб-страницы это надо) такую вещь не смогут правильно отрендерить?
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 19:45
Цитата: Red Khan от ноября 24, 2020, 19:42
Хотите сказать что браузера (а мне ведь в конечном итоге для веб-страницы это надо) такую вещь не смогут правильно отрендерить?
Судя по тому, что в английской статье Вики про Амуна имя иероглифами дано картинкой так оно и есть.
(wiki/en) Amun (https://en.wikipedia.org/wiki/Amun)
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 24, 2020, 19:46
Честно, не знаю. Но это Unicode 12.0. Хоть он и вышел ещё в марте прошлого года, но не все могли так заморочиться.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 24, 2020, 19:47
Цитата: Red Khan от ноября 24, 2020, 19:45Судя по тому, что в английской статье Вики про Амуна имя иероглифами дано картинкой
Так WikiHiero для этого и придумывали. Теперь, пока у всех юзеров 12-й Уникод не будет работать, они будут WikiHiero поддерживать.

Там в коде стоит:<table class="mw-hiero-table">
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 19:48
Цитата: Bhudh от ноября 24, 2020, 19:46
Честно, не знаю. Но это Unicode 12.0. Хоть он и вышел ещё в марте прошлого года, но не все могли так заморочиться.
А не знаете их можно через Alt вставить?
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 24, 2020, 19:50
:donno: А цтрл-ц-цтрл-в не работает, что ли?
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 19:53
Цитата: Bhudh от ноября 24, 2020, 19:47
Цитата: Red Khan от ноября 24, 2020, 19:45Судя по тому, что в английской статье Вики про Амуна имя иероглифами дано картинкой
Так WikiHiero для этого и придумывали. Теперь, пока у всех юзеров 12-й Уникод не будет работать, они будут WikiHiero поддерживать.
Я извиняюсь за банальные вопросы, но этот WikiHiero это расширение для чего и что именно он делает?
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 24, 2020, 19:58
Для движка MediaWiki. В Википедии оно установлено и активно используется: иероглифы рисуются не вручную, а именно им.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 20:00
Цитата: Bhudh от ноября 24, 2020, 19:50
:donno: А цтрл-ц-цтрл-в не работает, что ли?
А что там копировать?
Что-то не выходит. :(
𓅓𓐰𓂢
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 24, 2020, 20:01
Цитата: Red Khan от ноября 24, 2020, 20:00𓂢
𓂣
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 20:01
Цитата: Bhudh от ноября 24, 2020, 19:58
Для движка MediaWiki. В Википедии оно установлено и активно используется: иероглифы рисуются не вручную, а именно им.
Видимо под "рисуется" подразумеваются вставляет картинки с иероглифами?
Тогда понятно, спасибо.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 20:02
Цитата: Bhudh от ноября 24, 2020, 20:01
Цитата: Red Khan от ноября 24, 2020, 20:00𓂢
𓂣
Да, не та часть тела. :)
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 24, 2020, 20:03
Цитата: Red Khan от ноября 24, 2020, 20:01под "рисуется" подразумеваются вставляет картинки с иероглифами?
Вставляет таблицей нужным составом и ещё и со всплывающими подсказками к каждому элементу.
Но в принципе вместо картинок можно подставить и уникодовские соответствующего размера: у тех, кому их видно, мало что изменится.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 20:36
Цитата: Bhudh от ноября 24, 2020, 20:03
со всплывающими подсказками
О, там и всплывающие подсказки есть, которые показывают что это за иероглиф. Прикольно. :)
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 24, 2020, 21:04
Что-то не получается у меня, или я что-то не то делаю. Максимум что вышло это в WordPad (вводишь шестнадцатеричный код, потом нажимаешь Alt+x) получить вот такое:


Погуглил ещё немного. Судя вот по этому (https://github.com/googlefonts/noto-fonts/issues/1469) и этому (https://github.com/harfbuzz/harfbuzz/issues/2727) шрифт тоже должен поддерживать эти символы. Но пока такие шрифты есть только экспериментальные. Так что видимо придётся подождать пару лет.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 24, 2020, 23:23
Н-да, свежачок...
После полутора лет никто даже не разобрался, как этот вертикальный кернинг должон работать :(.
Хоть в шрифтовики иди и делай OTFv2.0.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 24, 2020, 23:25
Цитата: //ru.wikipedia.org/wiki/OpenTypeПоследний выпуск     1.8.1 (4 января 2017; 3 года назад)
:o Так он уже почти 4 года не обновляется⁈

P. S. Вот рувикипедисты чортовы...
Цитата: //en.wikipedia.org/wiki/OpenTypeLatest release   1.8.3     (21 August 2018; 2 years ago)

P. P. S. Вот англовикипедисты факовы...
Уже ж 1.8.4... Наисвежайшая.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 10:46
Цитата: Bhudh от ноября 24, 2020, 23:23
После полутора лет никто даже не разобрался, как этот вертикальный кернинг должон работать :(.
Да вроде как разобрались, вот здесь (https://github.com/harfbuzz/harfbuzz/issues/2721) даже есть скриншоты.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 11:42
Ага, разобрались.
Цитата: The current, incorrect, rendering in Chrome (86.0.4240.75)
...
The previous, correct, rendering in Firefox (69.0)
Тут работает, там не работает.

Вот тут (https://github.com/harfbuzz/harfbuzz/issues/2558) хотя бы джва движка нормально отображают (кстати, раз у Вас десятка, посмотрите через Edge).
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 11:48
Цитата: Bhudh от ноября 25, 2020, 11:42
Тут работает, там не работает.
Так закрыт же и в конце пишут что пофиксили. :)
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 11:51
А чего Вы тогда жалуетесь?
Цитата: Red Khan от ноября 24, 2020, 20:00Что-то не выходит. :(
𓅓𓐰𓂢
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 12:03
Цитата: Bhudh от ноября 25, 2020, 11:42
Вот тут (https://github.com/harfbuzz/harfbuzz/issues/2558) хотя бы джва движка нормально отображают (кстати, раз у Вас десятка, посмотрите через Edge).
Не Edge
Цитироватьusing Internet Explorer on Windows 10
Edge сейчас тоже на Chromium перешёл.

Собственно вот как тестовая страница отображается в IE (после установки шрифта)


А вот как в Edge (в FF и Хроме так же)
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 12:06
Цитата: Bhudh от ноября 25, 2020, 11:51
А чего Вы тогда жалуетесь?
Цитата: Red Khan от ноября 24, 2020, 20:00Что-то не выходит. :(
𓅓𓐰𓂢
Так работает же не "из коробки". Win10 для рендера египетских иероглифов использует Segoe UI Historic (https://en.wikipedia.org/wiki/Segoe#Variations).
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 12:06
Блин, я думал, разработка IE в пользу Edge прекращена! :o
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 12:10
Цитата: Bhudh от ноября 25, 2020, 12:06
Блин, я думал, разработка IE в пользу Edge прекращена! :o
Так оно и есть. :) А Edge потом перешёл на Chromium. :)

Правда я не знаю, возобновили ли после этого разработку IE, но думаю врядли.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 12:20
Всё равно не понимаю. Segoe UI Historic — шрифт 2014 года, в нём физически EHFC нет. И он даже не .otf. Получается, всю работу делает движок.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 12:30
Цитата: Bhudh от ноября 25, 2020, 12:20
Всё равно не понимаю. Segoe UI Historic — шрифт 2014 года, в нём физически EHFC нет. И он даже не .otf. Получается, всю работу делает движок.
Так там зипка с тестовой страницей и со шрифтом, в котором эти самые EHFC есть. Причём кажется что только те, что используются на тестовой странице - "EGYPTIAN HIEROGLYPH INSERT AT BOTTOM START" и "EGYPTIAN HIEROGLYPH INSERT AT TOP END", потому что сверху сову, а снизу руку я написать не могу. :(

Если шрифт удалить, IE так же будет неправильно отображать.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 12:50
Цитата: Red Khan от ноября 25, 2020, 12:30
Причём кажется что только те, что используются на тестовой странице
Собственно вот весь шрифт.


Только странные какие-то коды показывает, FE00, FE01 и FE02

Хотя в коде страницы указаны те, которые тут (https://en.wiktionary.org/wiki/Appendix:Unicode/Egyptian_Hieroglyph_Format_Controls)
<span class='egyp'>&#x1315C;&#x13433;&#x1308b;&#x13434;&#x133cf;</span>
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 12:53
Цитата: Red Khan от ноября 25, 2020, 12:50
Только странные какие-то коды показывает, FE00, FE01 и FE02
(wikt/en) Appendix:Unicode/Variation_Selectors (https://en.wiktionary.org/wiki/Appendix:Unicode/Variation_Selectors)
:what:
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 13:00
Цитата: Red Khan от ноября 25, 2020, 12:30
Если шрифт удалить, IE так же будет неправильно отображать.
Кстати, если удалить шрифт отображается не так
Цитата: Red Khan от ноября 25, 2020, 12:03
А вот как в Edge (в FF и Хроме так же)


А просто подряд строчка - иероглиф, квадратик, иероглиф, квадратик, иероглиф.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 13:12
Цитата: Red Khan от ноября 25, 2020, 12:50Только странные какие-то коды показывает
BabelMap (https://www.babelstone.co.uk/Software/BabelMap.html) скачайте, виндовская таблица в высшие плоскостя́ не умеет.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 13:18
Offtop
Ух ты, в 13-й версии вкладочки плоскостей появились!
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 13:37
Цитата: Bhudh от ноября 25, 2020, 13:12
Цитата: Red Khan от ноября 25, 2020, 12:50Только странные какие-то коды показывает
BabelMap (https://www.babelstone.co.uk/Software/BabelMap.html) скачайте, виндовская таблица в высшие плоскостя́ не умеет.
Спасибо! Таки всё есть вроде.


Осталось выяснить как ими пользоваться. Вот это вот
Цитата: Red Khan от ноября 25, 2020, 12:03

в коде выглядит вот так
<span class='egyp'>&#x1315C;&#x13433;&#x1308b;&#x13434;&#x133cf;</span>
то есть
"EGYPTIAN HIEROGLYPH G025"(журавль) "EGYPTIAN HIEROGLYPH INSERT AT BOTTOM START" "EGYPTIAN HIEROGLYPH D021"(рот) "EGYPTIAN HIEROGLYPH INSERT AT TOP END" "EGYPTIAN HIEROGLYPH X001"(хлеб).

Но тут в какой бы последовательности я не записал, все равно не выходит. :( Хотя я подозреваю что нужно не только присутствие в шрифте символов Format Controls, но и сами иероглифы должны поддерживать такое с ними обращение, причём именно конкретное - журавля из тестового шрифта вместо рта или хлеба не засунуть.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 13:38
Шрифт Aegyptus (https://dn-works.com/ufas): в нём есть всё. Не только полный блок иеров и EHFC, но и 6427 лигатур и всяких допсимволов в Private Use.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 13:52
Цитата: Bhudh от ноября 25, 2020, 13:38
Шрифт Aegyptus (https://dn-works.com/ufas): в нём есть всё. Не только полный блок иеров и EHFC, но и 6427 лигатур и всяких допсимволов в Private Use.
Спасибо. Но что-то он не может даже в то, что умеет тестовый.



Ну или я что-то не то делаю, я просто заменил шрифт в html.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 13:56
Попробуйте открыть приложенный Aegyptus.odt (если, конечно, есть OpenOffice).
Вроде он должен уметь.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 13:56
Цитата: Red Khan от ноября 25, 2020, 13:52я просто заменил шрифт в html
А в каком браузере-то смотрите? Который умеет или который нет?
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 14:02
Цитата: Bhudh от ноября 25, 2020, 13:56
Попробуйте открыть приложенный Aegyptus.odt (если, конечно, есть OpenOffice).
Вроде он должен уметь.
Лень ставить, да оно и в pdf формате есть. Просто стало интересно почему в браузере не получается.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 14:05
Цитата: Bhudh от ноября 25, 2020, 13:56
Цитата: Red Khan от ноября 25, 2020, 13:52я просто заменил шрифт в html
А в каком браузере-то смотрите? Который умеет или который нет?
Перепроверил, точно тот который умеет.

Кстати это же IE, может и на XP он сумеет?
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 14:29
Так это какой IE нужен-то? Мой 8-й не умеет (и вообще на безопасность ЛФ ругаиццо...).
Цитата: IE 8
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 14:35
Тестовая зипка вот так:
Цитировать(https://puu.sh/GR6Th.png)
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 14:43
Цитата: Bhudh от ноября 25, 2020, 14:29
Так это какой IE нужен-то?
11-ый.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Bhudh от ноября 25, 2020, 14:46
Цитата: Red Khan от ноября 25, 2020, 14:43
Цитата: Bhudh от ноября 25, 2020, 14:29Так это какой IE нужен-то?
11-ый.
(https://puu.sh/GR71X.png)

Под XP его нет.
Название: Помогите перевести египетские иероглифы из картинки в Unicode
Отправлено: Red Khan от ноября 25, 2020, 15:14
Цитата: Bhudh от ноября 25, 2020, 14:46
Под XP его нет.
Да, по XP максимальная это восьмёрка, забыл написать.

Я подумал может сработает, мало ли. Движок-то один.