Лингвофорум

Теоретический раздел => Прикладная лингвистика => Компьютерная лингвистика => Тема начата: Red Khan от июня 5, 2021, 12:22

Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 5, 2021, 12:22
Довольно часто сталкиваюсь с такой проблемой - мне нужно вставить предложение на арабице в текст который написан на латинице или кириллице. Но при этом последняя точка в конце последнего предложения уезжает непонятно куда. Как пример:
Цитата: Red Khan от июня  4, 2021, 21:49
.قزان، پورخاوایده ۲ نچی مسجدنڭ رسمی. قزانسودا گیری احمدعلی بن میڭلی‌بای بن عبدالرفیع رفیقف طرفندن ۱۸۹۹ نچی سنه‌ده بنا یدله باشلاب ۱۹۰۰ نچی یل غنوارده برنچی مرتبه جمه اوقولدی
Как это можно поправить?
Название: Точка в конце предложения на арабице
Отправлено: Bhudh от июня 5, 2021, 12:26
Это зависит от системы, устройства, шрифта, да чего угодно.
Обычно-то точка нормально ставится:
Цитата: Red Khan от июня  5, 2021, 12:22(https://puu.sh/HMr83.png)
Но если прям очень нужно, чтобы везде была одинаково, то можно использовать символы-указатели написания справа налево... или печать нормальным шрифтом в PDF.
Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 5, 2021, 12:38
Цитата: Bhudh от июня  5, 2021, 12:26
Обычно-то точка нормально ставится
На скриншоте не нормально же.

Цитата: Bhudh от июня  5, 2021, 12:26
символы-указатели написания справа налево
А как их ставить не подскажете?
Название: Точка в конце предложения на арабице
Отправлено: Leo от июня 5, 2021, 13:21
в арабских еврейских и арамейских шрифтах пока не перейдёшь на "справа-налево" будет всякое такое вылезать. правда и когда перейдёшь иной раз вылезает
Название: Точка в конце предложения на арабице
Отправлено: Bhudh от июня 5, 2021, 14:09
Цитата: Red Khan от июня  5, 2021, 12:38На скриншоте не нормально же.
:??? А какую именно точку Вы имеете в виду?
Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 5, 2021, 15:37
Цитата: Bhudh от июня  5, 2021, 14:09
Цитата: Red Khan от июня  5, 2021, 12:38На скриншоте не нормально же.
:??? А какую именно точку Вы имеете в виду?
Которая в самом конце цитаты. Нажмите "Цитировать" на моё первое сообщение и увидите.
Название: Точка в конце предложения на арабице
Отправлено: Bhudh от июня 5, 2021, 16:16
Цитата: Red Khan от июня  5, 2021, 15:37Нажмите "Цитировать" на моё первое сообщение и увидите.

Нажал:
Цитата: (https://puu.sh/HMtk2.png)

Увидел, что при наборе текста, похоже, вообще точку поставили не там (видимо, ввод пробела обламывает ввод «справа налево», а точка его, естественно, не включает).
А при попытке выделить через перенос это становится видно наглядно — точка не выделяется:
Цитата: (https://puu.sh/HMtmz.png)
Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 5, 2021, 17:02
Хмм... странно. А у меня так:


Я, кажется понял, точка всегда в конце первой строки, неважно сколько строк.

Вопрос в том, как сделать так, чтобы она была в конце текста?
Название: Точка в конце предложения на арабице
Отправлено: Bhudh от июня 5, 2021, 17:32
Цитата: Red Khan от июня  5, 2021, 17:02Я, кажется понял, точка всегда в конце первой строки
Она бы тогда выделилась при переносе выделения.
Точка всегда видима в конце первой строки. А стоит она по факту в начале текста. То есть она читается слева направо. А после неё идёт справаналевный текст.
Попробуйте начать выделение с точки (с левой её стороны) и посмотрите, как выделяется.
Название: Точка в конце предложения на арабице
Отправлено: Bhudh от июня 5, 2021, 17:36
Цитата: Red Khan от июня  5, 2021, 17:02Вопрос в том, как сделать так, чтобы она была в конце текста?
Начать ввод арабицы с RLM (https://en.wikipedia.org/wiki/Right-to-left_mark) или ALM (https://en.wikipedia.org/wiki/Arabic_letter_mark), закончить ввод арабицы LRM (https://en.wikipedia.org/wiki/Left-to-right_mark).
Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 5, 2021, 17:52
Цитата: Bhudh от июня  5, 2021, 17:36
Цитата: Red Khan от июня  5, 2021, 17:02Вопрос в том, как сделать так, чтобы она была в конце текста?
Начать ввод арабицы с RLM (https://en.wikipedia.org/wiki/Right-to-left_mark) или ALM (https://en.wikipedia.org/wiki/Arabic_letter_mark), закончить ввод арабицы LRM (https://en.wikipedia.org/wiki/Left-to-right_mark).
Спасибо. Сейчас разберусь как это вводить.

А в чём разница между RLM и ALM интересно? Почему для арабского есть отдельный ALM? Википедия деталей не даёт.
ЦитироватьSimilar to Right-to-left mark (RLM), it is used to change the way adjacent characters are grouped with respect to text direction, with some difference on how it affects the bidirectional level resolutions for nearby characters.
Название: Точка в конце предложения на арабице
Отправлено: Bhudh от июня 5, 2021, 18:11
Возможно, ALM действует только на ближневосточные письмена. Не проверял.
Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 5, 2021, 18:27
Нагуглил вот:
Цитата: https://www.fileformat.info/tip/microsoft/enter_unicode.htmMethod 1: Universal

    This method works regardless of any of your language settings, but is the most cumbersome to type.

        Press and hold down the Alt key.
        Press the + (plus) key on the numeric keypad.
        Type the hexidecimal unicode value.
        Release the Alt key.
Alas, this appears to require a registry setting. It was already set on my computer, but some readers report that this method didn't work for them, and this is probably why. If you don't know what the registry is, please don't try this. Under HKEY_Current_User/Control Panel/Input Method, set EnableHexNumpad to "1". If you have to add it, set the type to be REG_SZ.
У меня оно работает, могу вводить разные символы вот из этого списка - (wiki/en) List_of_Unicode_characters

Получилось, спасибо! Надо в конце, перед [/size] поставить точку, а потом RLM.
Цитата: Red Khan от июня  4, 2021, 21:49
‎قزان، پورخاوایده ۲ نچی مسجدنڭ رسمی. قزانسودا گیری احمدعلی بن میڭلی‌بای بن عبدالرفیع رفیقف طرفندن ۱۸۹۹ نچی سنه‌ده بنا یدله باشلاب ۱۹۰۰ نچی یل غنوارده برنچی مرتبه جمه اوقولدی؜.‏
Название: Точка в конце предложения на арабице
Отправлено: kemerover от июня 5, 2021, 20:43
Цитата: Red Khan от июня  5, 2021, 17:52
А в чём разница между RLM и ALM интересно? Почему для арабского есть отдельный ALM? Википедия деталей не даёт.
Наверное, разница в том, что арабский текст в Юникоде, строго говоря, понимается не как справа налево, а как бинаправленный, так как числа там, по мнению Юникода, записываются слева направо.
Название: Точка в конце предложения на арабице
Отправлено: Bhudh от июня 5, 2021, 20:44
Вот и отлично. Правда, про ввод с альтом уже пару тысяч раз на ЛФ упоминалось, но, как известно, ничего не запоминаешь до тех пор, пока оно резко не понадобится...
Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 5, 2021, 20:59
Цитата: Bhudh от июня  5, 2021, 20:44
как известно, ничего не запоминаешь до тех пор, пока оно резко не понадобится...
Пока сам это не сделаешь пару десятков раз, если быть точнее. :)

Ну тут я хотя бы запомню, что есть такая тема где можно посмотреть как оно делается. :)
Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 5, 2021, 21:00
Цитата: kemerover от июня  5, 2021, 20:43
Цитата: Red Khan от июня  5, 2021, 17:52
А в чём разница между RLM и ALM интересно? Почему для арабского есть отдельный ALM? Википедия деталей не даёт.
Наверное, разница в том, что арабский текст в Юникоде, строго говоря, понимается не как справа налево, а как бинаправленный, так как числа там, по мнению Юникода, записываются слева направо.
Да, числа при выделении себя ведут как текст слева направо, заметил это на тексте выше.
Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 6, 2021, 16:55
Вот ещё задачка - как ввести нижеследующее, чтобы получилось как на картинке, то есть цифра была бы справа. Что только не пробовал, все равно не получается.
۲ نچی

Название: Точка в конце предложения на арабице
Отправлено: RawonaM от июня 6, 2021, 17:10
Цитата: Red Khan от июня  6, 2021, 16:55
Вот ещё задачка - как ввести нижеследующее, чтобы получилось как на картинке, то есть цифра была бы справа. Что только не пробовал, все равно не получается.
۲ نچی



۲ نچی
Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 6, 2021, 18:32
BBC коды не считается. :)
Мне бы в Word или в другом приложении, с помощью юникодовских символов.
Название: Точка в конце предложения на арабице
Отправлено: Andrey Lukyanov от июня 6, 2021, 18:34
‏۲ نچی

Перед текстом стоит "right-to-left mark" (200F).
Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 6, 2021, 18:36
Цитата: Andrey Lukyanov от июня  6, 2021, 18:34
Перед текстом
С какой стороны перед - справа или слева? :)
Название: Точка в конце предложения на арабице
Отправлено: Andrey Lukyanov от июня 6, 2021, 19:00
Цитата: Red Khan от июня  6, 2021, 18:36
С какой стороны перед - справа или слева? :)
Этот символ невидимый. Но если рассматривать порядок символов в файле, то 200F стоит ближе к началу файла.

200F   RIGHT-TO-LEFT MARK
06F2   EXTENDED ARABIC-INDIC DIGIT TWO
0020   SPACE
0646   ARABIC LETTER NOON
0686   ARABIC LETTER TCHEH
06CC   ARABIC LETTER FARSI YEH
Название: Точка в конце предложения на арабице
Отправлено: Red Khan от июня 6, 2021, 22:52
‏۲ نچی
И вправду получилось, спасибо.

До этого вроде пробовал вставлять RLM перед двойкой, но ничего не получалось.