Лингвофорум

Лингвоблоги => Личные блоги => Блоги => Oleg Grom => Тема начата: Oleg Grom от октября 8, 2011, 22:34

Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 8, 2011, 22:34
Чего только нет в кириллической части юникода. Можно даже найти символы алфавивитов, употреблявшихся чуть ли не для нескольких письменных памятников. Для исторической кириллицы предусмотрены всякие зеркальные начертания, глазастые О и еще куча всякого не особо нужного хлама. Но вот для буквы ю с краткой, употреблявшейся несколько столетий, места видите ли не нашлось. Ладно бы была краткая в качестве комбинируещего диакритика, так нету ее. Приходится использовать костыли в виде ю + combining breve. Но во многих шрифтах краткая и бревис рисуются по-разному  >( Не говоря уже о том, что в большинстве шрифтов комбинирующие диакритики безбожно плывут (см. вложение: шрифты times new roman и old standard). Доколѣ!?

Также неплохо было бы иметь соответствующие символы для і̆ (і с краткой) и ꙋ̆ (гаммообразный ук с краткой), использовавшихся в в поздней кириллице. Для инициальных е, з, о место в юникоде нашлось, но почему бы не добавить еще и "широкое с" (актуально не только для румыницы, но и для западнорусских (украинских) изданий 17-19 вв.). Ну и предел мечтаний - лигатурное іꙋ для некоторых форм поздней румынской кириллицы и переходных алфавитов.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: I. G. от октября 8, 2011, 22:35
Цитата: Oleg Grom от октября  8, 2011, 22:34
[ПлачЪ]
Вот и Вы поддались искушению.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 13, 2011, 19:11
Посмотрел список символов, принятых в юникод: http://www.unicode.org/alloc/Pipeline.html
С кириллицей все как обычно печально.
Вот какова реальная польза от этого?
ЦитироватьCYRILLIC CAPITAL LETTER DOUBLE O
CYRILLIC SMALL LETTER DOUBLE O
CYRILLIC CAPITAL LETTER CROSSED O
CYRILLIC SMALL LETTER CROSSED O

Ю с краткой используется в казымском и шурышкарском диалектах хантыйского языка. Интересно их в юникод кто-нибудь собирается продвигать? Все, что нагуглил на эту тему: (wiki/ru) Википедия:Проект:Внесение_символов_алфавитов_народов_России_в_Юникод#Алфавиты_народов_Западной_Сибири (http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%9F%D1%80%D0%BE%D0%B5%D0%BA%D1%82:%D0%92%D0%BD%D0%B5%D1%81%D0%B5%D0%BD%D0%B8%D0%B5_%D1%81%D0%B8%D0%BC%D0%B2%D0%BE%D0%BB%D0%BE%D0%B2_%D0%B0%D0%BB%D1%84%D0%B0%D0%B2%D0%B8%D1%82%D0%BE%D0%B2_%D0%BD%D0%B0%D1%80%D0%BE%D0%B4%D0%BE%D0%B2_%D0%A0%D0%BE%D1%81%D1%81%D0%B8%D0%B8_%D0%B2_%D0%AE%D0%BD%D0%B8%D0%BA%D0%BE%D0%B4#.D0.90.D0.BB.D1.84.D0.B0.D0.B2.D0.B8.D1.82.D1.8B_.D0.BD.D0.B0.D1.80.D0.BE.D0.B4.D0.BE.D0.B2_.D0.97.D0.B0.D0.BF.D0.B0.D0.B4.D0.BD.D0.BE.D0.B9_.D0.A1.D0.B8.D0.B1.D0.B8.D1.80.D0.B8)
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Dana от октября 13, 2011, 19:29
Цитата: Oleg Grom от октября  8, 2011, 22:34
Ну и предел мечтаний - лигатурное іꙋ
Лигатурное что?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: autolyk от октября 13, 2011, 19:32
Лигатура и десятеричного и ука.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 13, 2011, 19:46
Цитата: autolyk от октября 13, 2011, 19:32
Лигатура и десятеричного и ука.
Оно самое. Выглядело как-то так.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: autolyk от октября 13, 2011, 19:48
Интересно, а эта лигатура где-то реально использовалась?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 13, 2011, 19:58
Цитата: autolyk от октября 13, 2011, 19:48
Интересно, а эта лигатура где-то реально использовалась?
Конечно. Например, вотЪ:
http://books.google.com/books?id=JTsQAAAAYAAJ&pg=PT426#v=onepage&q&f=false
http://books.google.ro/books?id=kvgRAAAAYAAJ&pg=PA111#v=onepage&q&f=false

В переходных алфавитах ее использовали довольно последовательно.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: autolyk от октября 13, 2011, 20:06
Спасибо, действительно интересно.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Vertaler от октября 13, 2011, 21:04
Так это, вроде бы, кто подавал петицыю, того и гешефт. Последний блок копирует петицию какого-то чувака с красивой еврейской фамилией.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Тайльнемер от октября 14, 2011, 06:47
Цитата: Oleg Grom от октября  8, 2011, 22:34
Но вот для буквы ю с краткой, употреблявшейся несколько столетий, места видите ли не нашлось. Ладно бы была краткая в качестве комбинируещего диакритика, так нету ее. Приходится использовать костыли в виде ю + combining breve. Но во многих шрифтах краткая и бревис рисуются по-разному  (" title=">(" border="0" class="smiley"> Не говоря уже о том, что в большинстве шрифтов комбинирующие диакритики безбожно плывут
Как всегда, рулит Cambria. Тут и форма дужки нужная, и позиция:
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Тайльнемер от октября 14, 2011, 06:57
То, что уникодовцы не захотели различать бревис и кратку — это, конечно, нехорошо, но камбрия различает их по блокам — кратка всегда используется для кириллических букв.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 14, 2011, 11:18
А у Вас что за камбрия?
Моя Version 5.96 так не умеет...

Upd.: А, нет, умеет, но только в Ворде. В BabelPadʼe как-то % на 10...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 14, 2011, 14:41
Цитата: Тайльнемер от октября 14, 2011, 06:47
Как всегда, рулит Cambria.
Рулит, но не для румынского. Ибо нет буквы ꙟ, ꙗ, гаммаобразного ука и много еще чего, а подставленная из других шрифтов выглядит неайс. Да и специфическая диакритика мягко говоря "плывет". Old Standard во всем кроме ю̆ предпочтительней. Ну и мой самопал подходит, естественно :)

Хали́па алека́се ла Ѹ̑ниверсита́тѣ дин Ꙗ҆́шй шѝ се па́ре къ лꙋ́птеле є̑лектора́ле върса́серъ дин белшꙋ́г деꙁнъде́жде ꙟ̑ сꙋ́флетꙋл че́лѡр ка́ре ръмъсе́серъ ла Кишинъ́ꙋ. І̑еромона́хꙋл Гꙋ́рїе а типъри́т ѹ̑шо́р ка́ртѣ Ꙟ̑въцътꙋ́ра де́спре ле́џѣ лꙋй Дм҃нꙁе́ꙋ, ꙟ̑ а҆́нꙋл ҂ац҃и; ма́й а̑нево́е, ꙟ̑съ, въꙁꙋ̀ типа́рꙋл а̑до́ѡа ка́рте, ка́ре нꙋ а̑вѣ̀ дꙋ́пъ пъръ́рѣ кондꙋкъто́рилѡр бисѣриче́щй, ни́чй ѡ̑ легътꙋ́ръ кꙋ вїѧ́ца релиџїо́асъ.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Валентин Н от октября 14, 2011, 14:54
Камбрия справляется с многоэтажной диакритикой, но не справляется смногоэтажными подстрочниками...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: DarkMax2 от октября 14, 2011, 15:13
Цитата: Oleg Grom от октября 13, 2011, 19:46
Цитата: autolyk от октября 13, 2011, 19:32
Лигатура и десятеричного и ука.
Оно самое. Выглядело как-то так.
Красиво.

Cambria, конечно, рулит. А Юникод всё таки не шрифт, чтобы всё это от него требовать.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: I. G. от октября 14, 2011, 15:14
Цитата: Oleg Grom от октября 14, 2011, 14:41
Ибо нет буквы ꙟ, ꙗ,
И видишь 2 квадрата...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 14, 2011, 15:18
Цитата: DarkMax2 от октября 14, 2011, 15:13
А Юникод всё таки не шрифт, чтобы всё это от него требовать.
Но могли бы хоть какие-то стандартные шрифты распространять для своего стандарта. А так с момента ввода символа в юникод до момента, когда он появится в общедоступных шрифтах, лет пять приходится квадратиками любоваться.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: lehoslav от октября 14, 2011, 15:21
Цитата: I. G. от октября 14, 2011, 15:14
И видишь 2 квадрата...

Я только один :eat:
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 14, 2011, 15:24
Цитата: DarkMax2 от октября 14, 2011, 15:13
А Юникод всё таки не шрифт, чтобы всё это от него требовать.
Как раз-таки это проблема юникода. Бреве и краткая - это все-таки разные знаки и они должны различаться на уровне стандарта. То что в делают на уровне шрифтов - это костыли. Позиционные варианты букв, конечно можно сделать средствами шрифта. Все-таки ѻ\о, з\ꙁ, є\е, широкое\обычное "с" - это варианты одной буквы, а их разнесение по разным кодам только мешает, например, при поиске по тексту. Но раз уже начали городить костыли с выделением места под "исторические" начертания, то неплохо сделать бы это все последовательно и до конца
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 14, 2011, 15:28
Цитата: I. G. от октября 14, 2011, 15:14
И видишь 2 квадрата...
(wiki/ru) Ꙟ (http://ru.wikipedia.org/wiki/%EA%99%9E) и (wiki/ru) Ꙗ (http://ru.wikipedia.org/wiki/%EA%99%96)

Цитата: Python от октября 14, 2011, 15:18
А так с момента ввода символа в юникод до момента, когда он появится в общедоступных шрифтах, лет пять приходится квадратиками любоваться.
Есть же проект (универсалия, кажется, называется), где охвачен весь юникод.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 14, 2011, 15:31
Я так понимаю, всё идет к тому, что мы тут начнем составлять собственный LINGVOCODE?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: DarkMax2 от октября 14, 2011, 15:32
Почему это кратка и бреве разные знаки? Это начертания одного знака.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 14, 2011, 15:35
Цитата: DarkMax2 от октября 14, 2011, 15:32
Почему это кратка и бреве разные знаки? Это начертания одного знака.

Предлагаете объединить коды похожих символов латиницы и кириллицы?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 14, 2011, 15:42
Цитата: DarkMax2 от октября 14, 2011, 15:32
Почему это кратка и бреве разные знаки? Это начертания одного знака.
Исторически разные. И вообще, имхо плохая идея, делать общую дакритику для латиницы и кириллицы. Для греческого же выделили отдельные кодовые позиции для их надстрочных закорючек.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: DarkMax2 от октября 14, 2011, 15:42
Цитата: Hellerick от октября 14, 2011, 15:35
Цитата: DarkMax2 от октября 14, 2011, 15:32
Почему это кратка и бреве разные знаки? Это начертания одного знака.

Предлагаете объединить коды похожих символов латиницы и кириллицы?
Можно было бы, но у них значения разные, так что нет, а кратка и бреве имеют один смысл.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 14, 2011, 15:49
Цитата: DarkMax2 от октября 14, 2011, 15:42
Цитата: Hellerick от октября 14, 2011, 15:35
Цитата: DarkMax2 от октября 14, 2011, 15:32
Почему это кратка и бреве разные знаки? Это начертания одного знака.

Предлагаете объединить коды похожих символов латиницы и кириллицы?
Можно было бы, но у них значения разные, так что нет, а кратка и бреве имеют один смысл.

И чем отличаются значения латинской, кириллической и греческой О?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: DarkMax2 от октября 14, 2011, 15:50
Ну я про Р, например, говорил.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 14, 2011, 15:54
Цитата: Oleg Grom от октября 14, 2011, 15:28
Цитата: Python от октября 14, 2011, 15:18
А так с момента ввода символа в юникод до момента, когда он появится в общедоступных шрифтах, лет пять приходится квадратиками любоваться.
Есть же проект (универсалия, кажется, называется), где охвачен весь юникод.
В Универсалии присутствуют некоторые ошибки (например, начертание некоторых букв глаголицы не соответствует коду). Это не стандарт, а всего лишь еще один любительский шрифт, и с момента появления символа в стандарте до появления его в шрифте тоже проходит некоторое время.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 14, 2011, 17:22
Цитата: Python от В Универсалии присутствуют некоторые ошибки (например, начертание некоторых букв глаголицы не соответствует коду).
Автор вроде писал, что починил это дело в августе.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 14, 2011, 19:10
Цитата: Bhudh от октября 14, 2011, 17:22
Автор вроде писал, что починил это дело в августе.
Вроде сейчас все нормально.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Валентин Н от октября 14, 2011, 19:20
Чо-чо? Существует шрифт содержащий весь юникод???
Или я не так понял? сколько весит.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 14, 2011, 19:25
Цитата: Валентин Н от октября 14, 2011, 19:20
Чо-чо? Существует шрифт содержащий весь юникод???
Или я не так понял? сколько весит.
Мы ж про него и говорим. Полная поддержка юникоде 6.0 - http://magazeta.com/soft/2011/02/12/universalia-font/
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Валентин Н от октября 14, 2011, 20:13
Цитата: Oleg Grom от октября 14, 2011, 19:25
Мы ж про него и говорим. Полная поддержка юникоде 6.0 - http://magazeta.com/soft/2011/02/12/universalia-font/
Как вы думаете, если я щас все шрифты удалю и оставлю только те 2, что будет с лфом?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Wulfila от октября 14, 2011, 20:21
Цитата: Валентин Н от
Как вы думаете, если я щас все шрифты удалю и оставлю только те 2, что будет с лфом?
что за угрозы?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 14, 2011, 20:23
Цитата: Валентин Н от октября 14, 2011, 20:13
Как вы думаете, если я щас все шрифты удалю и оставлю только те 2, что будет с лфом?
Если вы удалите на своей машине все шрифты, то думаю форум от этого никак не пострадает.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Валентин Н от октября 14, 2011, 20:24
Не, серьёзно - если оставлю только те 2 у меня все символы что есть на лф видны будут?
Хочу провести опыт...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Валентин Н от октября 14, 2011, 20:26
Цитата: Oleg Grom от октября 14, 2011, 20:23
форум от этого никак не пострадает.
"что будет с лф" это метонимия (http://lingvoforum.net/index.php?action=dlattach;topic=26145.0;attach=14536;image)
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 14, 2011, 20:30
Цитата: Валентин Н от октября 14, 2011, 20:24
Не, серьёзно - если оставлю только те 2 у меня все символы что есть на лф видны будут?
В принципе, если у браузера нет проблем с подстановкой шрифтов, то он подставит какие есть, т.е. универсалию. Но боюсь, операционная система воспримет удаление всех шрифтов, включая системные, не очень адекватно и до входа на ЛФ дело вообще не дойдет.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Валентин Н от октября 14, 2011, 22:53
Удалил всё что возможно было.
Шрифт просто песетц, но зато ни единого квадрата...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Toivo от октября 14, 2011, 22:58
Цитата: Валентин Н от октября 14, 2011, 22:53
но зато ни единого квадрата...
Я аж завидую.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 14, 2011, 23:00
Зачем все удалять? На ЛФ можно в правом верхнем углу выбрать Custom font и вписать Universalia.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 14, 2011, 23:02
Цитата: Toivo от октября 14, 2011, 22:58
Я аж завидую.
Если шрифт установлен в системе, то браузер должен его подставлять сам, там где натыкается на квадраты.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Toivo от октября 14, 2011, 23:03
Цитата: Oleg Grom от октября 14, 2011, 23:02
Если шрифт установлен в системе, то браузер должен его подставлять сам, там где натыкается на квадраты.
Попробую скачать.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Валентин Н от октября 14, 2011, 23:05
Цитата: Python от октября 14, 2011, 23:00
Зачем все удалять? На ЛФ можно в правом верхнем углу выбрать Custom font и вписать Universalia.
чтоб убедиться, что не другие шрифты подставляет
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 14, 2011, 23:12
Цитата: Валентин Н от Удалил всё что возможно было.
Жистока.
А просто перенести из системной папки Fonts в любую другую не судьба была?
Восстановить-то так леххче.

Кстати, а Ваш песетс — это не System случайно?‥
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Toivo от октября 14, 2011, 23:14
Цитата: Toivo от октября 14, 2011, 23:03
Попробую скачать.
Установил. Квадратики остались. ЧЯДНТ?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 14, 2011, 23:17
ВНУШВБ.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 14, 2011, 23:18
Не все браузеры так умеют. Плюс еще выбор шрифта может быть не индивидуальным для каждого символа, а поблочно.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Toivo от октября 14, 2011, 23:18
Цитата: Bhudh от октября 14, 2011, 23:17
ВНУШВБ.
Информативно.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 14, 2011, 23:19
Цитата: Toivo от октября 14, 2011, 23:14
ЧЯДНТ?
Вы пользуетесь оперой :) Обычно у нее бывают проблемы с подстановкой шрифтов.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Валентин Н от октября 14, 2011, 23:19
Цитата: Bhudh от октября 14, 2011, 23:12
А просто перенести из системной папки Fonts в любую другую не судьба была?
Подразумевалось удаление из папки фонтс.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Toivo от октября 14, 2011, 23:20
Цитата: Python от октября 14, 2011, 23:18
Не все браузеры так умеют. Плюс еще выбор шрифта может быть не индивидуальным для каждого символа, а поблочно.
Я указал Универсалию в пользовательских шрифтах здесь. Всё равно квадратики. Или это тоже так браузер работает? :donno:
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 14, 2011, 23:20
Цитата: Toivo от октября 14, 2011, 23:18
Цитата: Bhudh от октября 14, 2011, 23:17
ВНУШВБ.
Информативно.
Цитата: Toivo от ЧЯДНТ?
Не менее.

Вон Python и то понял, что ВыНеУстановилиШрифтыВБраузере.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 14, 2011, 23:21
Еще браузер желательно перезапустить. Опера не видит шрифты, установленные во время текущего сеанса.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Квас от октября 14, 2011, 23:21
Цитата: Hellerick от октября 14, 2011, 15:31
Я так понимаю, всё идет к тому, что мы тут начнем составлять собственный LINGVOCODE?

;up: И шрифты под него рисовать! :yes:
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Toivo от октября 14, 2011, 23:25
Цитата: Oleg Grom от октября 14, 2011, 23:19
Вы пользуетесь оперой
В Фирефоксе вроде работает.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Toivo от октября 14, 2011, 23:26
Цитата: Bhudh от октября 14, 2011, 23:20
Цитата: Toivo от ЧЯДНТ?
Не менее.
Гуглится даже в яндексе.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 14, 2011, 23:28
Можа она и яндицо в гуглице, но общение аббр-ми — неуважение к собеседнику.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Toivo от октября 14, 2011, 23:38
Цитата: Dana от сентября 18, 2010, 22:16
ЧЯДНТ?
Цитата: Dana от ноября 13, 2010, 12:38
ЧЯДНТ?
Цитата: Dana от августа  3, 2011, 20:42
ЧЯДНТ?
Цитата: Demetrius от мая 14, 2011, 11:39
ЧЯДНТ?
Цитата: Oleg Grom от августа 27, 2011, 19:47
ЧЯДНТ?
Цитата: Oleg Grom от июня 24, 2011, 16:42
ЧЯДНТ?
Цитата: maristo от мая  8, 2011, 20:07
ЧЯДНТ?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 14, 2011, 23:49
Так. Поиск постов по опр. юзеру опять не работает! >(
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Квас от октября 14, 2011, 23:49
Offtop
ЧА-ЩА пиши с А!
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Валентин Н от октября 15, 2011, 13:58
Цитата: Bhudh от октября 14, 2011, 23:49
Так. Поиск постов по опр. юзеру опять не работает!
ого, а как это раньше работало?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 15, 2011, 14:52
Цитата: Bhudh от октября 14, 2011, 23:28
Можа она и яндицо в гуглице, но общение аббр-ми — неуважение к собеседнику.
:fp:

Аббревиатура аббревиатуре рознь.

Цитата: Квас от октября 14, 2011, 23:21
Цитата: Hellerick от октября 14, 2011, 15:31
Я так понимаю, всё идет к тому, что мы тут начнем составлять собственный LINGVOCODE?

;up: И шрифты под него рисовать! :yes:
Мне кажется, что надо коренным образом пересмотреть подход к китайским шрифтам. Например, хотя бы делать самые частые компоненты комбинируемыми.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 15, 2011, 14:55
Цитата: Demetrius от октября 15, 2011, 14:52
Мне кажется, что надо коренным образом пересмотреть подход к китайским шрифтам. Например, хотя бы делать самые частые компоненты комбинируемыми.

А отдельные коды для хангылей вообще в топку?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 15, 2011, 15:03
Цитата: Hellerick от октября 15, 2011, 14:55
Цитата: Demetrius от октября 15, 2011, 14:52
Мне кажется, что надо коренным образом пересмотреть подход к китайским шрифтам. Например, хотя бы делать самые частые компоненты комбинируемыми.

А отдельные коды для хангылей вообще в топку?
Деванагари же как-то обходится без кодов для лигатур?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 15, 2011, 15:09
Костыли в приватюзе.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 15, 2011, 15:13
Цитата: Python от октября 15, 2011, 15:03
Деванагари же как-то обходится без кодов для лигатур?

Ну дык и я об них же.

Помню, еще в 1997 у меня был корейский шрифт, который позволял писать хангыли не смотря на то, что корейские символы занимали лишь верхние 128 позиций кодовой таблицы. Как-то очень умно располагались эти закорючки, что при их наложении друг на друга получались все (?) возможные хангыли. Будь такое имплементировано в Юникоде — столько бы места освободилось!
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 15, 2011, 15:17
Цитата: Hellerick от октября 15, 2011, 14:55
Цитата: Demetrius от октября 15, 2011, 14:52
Мне кажется, что надо коренным образом пересмотреть подход к китайским шрифтам. Например, хотя бы делать самые частые компоненты комбинируемыми.

А отдельные коды для хангылей вообще в топку?
Насчёт хангылей не уверен. Тут нало внимательное рассмотрение, а то может оказаться, что исторические хангыли ненабирабельны...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 15, 2011, 15:20
Тут есть три варианта: либо делать фрагментарные символы такой формы, чтобі они хорошо подходили друг другу (но тогда о некоторых шрифтах можно забыть), либо делать готовые глифы с отдельными кодами (либо пользовательские, либо стандантизированные), либо подстановка лигатур вместо последовательностей символов (дополнительные требования к пользовательскому софту).
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 15, 2011, 15:22
Вообще, я думаю, нужно делать не Юникод, а «язык универсальной разметки символов», который позволит в ASCII строках кодировать любые символы. В том числе и средствами стандартизированной транслитерации. Например, слово «символ» могло бы в нем кодироваться как «\cyr{simvol}».
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 15, 2011, 15:25
ТеХовская разметка громоздковата, как и htmlевская. Я раньше пробовал сделать что-то типа универсального транслита с метками переключения транслитерации. Что-то в таком стиле:
&@cyr;tekst tekst tekst &@glag;tekst &@greek;text
должно отображаться как
текст текст текст ⱅⰵⰽⱄⱅ τεξτ
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 15, 2011, 15:31
Цитата: Python от октября 15, 2011, 15:25
Я раньше пробовал сделать что-то типа универсального транслита с метками переключения транслитерации.

+1  :)
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 15, 2011, 15:49
Цитата: Hellerick от \cyr{simvol}
Цитата: Python от &@cyr;

Цитата: Python от ТеХовская разметка громоздковата
:what:
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 15, 2011, 15:58
Цитата: Hellerick от октября 15, 2011, 15:22
Вообще, я думаю, нужно делать не Юникод, а «язык универсальной разметки символов», который позволит в ASCII строках кодировать любые символы. В том числе и средствами стандартизированной транслитерации. Например, слово «символ» могло бы в нем кодироваться как «\cyr{simvol}».
Это не интересно. Такая разметка у каждого будет своя. Мне, например, было бы удобнее кодировать иероглифы кродами ЦанЦзе (например, \cj{hqi bbpe ino}), а кому-то будет удобнее что-то другое...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 15, 2011, 16:03
Цитата: Python от октября 15, 2011, 15:25
ТеХовская разметка громоздковата, как и htmlевская.

Ну, можно определить, что после того, как была введена метка \cyr, любой текст в фигурных скобках будет интерпретироваться как кириллица, пока не будет введена новая метка. Типа такого:


Russian:
\cyr{koshka} = cat
{sobaka} = dog
{xomyachok} = evil monster

Japanese:
\hir{neko} = cat
{inu} = dog


Так что получится негромоздко.

Каждой системе письменности полагается иметь свой код и правила интерпретации его параметров. Желательно, чтобы эти правила были максимально подобны друг другу.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 15, 2011, 16:24
Цитата: Bhudh от октября 15, 2011, 15:49
Цитата: Hellerick от \cyr{simvol}
Цитата: Python от &@cyr;

Цитата: Python от ТеХовская разметка громоздковата
:what:
Изначально задумывалось как набор виртуальных символов-переключателей, дополняющих html - отсюда и форма &....;
В html подобным образом кодируется отдельный символ, что для текста, полностью состоящего из таких символов, неудобно. ТеХ ближе к идеалу, но блочная структура имеет смысл лишь при вложении (что в нашем случае не требуется).
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 15, 2011, 16:27
Число символов одынакое...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 15, 2011, 16:29
Я бы скорее коды для языков. Два очевидных плюса:
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 15, 2011, 16:34
ЦитироватьЯ бы скорее коды для языков.
Собственно, я для языков ее и делал. Хотя эту систему можно приспособить для чего-угодно — и для отдельных языков, и для обобщенных графических систем, типа кириллицы или расширенной латиницы.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 15, 2011, 16:34
Цитата: Demetrius от октября 15, 2011, 16:29Я бы скорее коды для языков.

Проблема в том, что языки придется указывать вручную.
Появится в английском тексте одинокая кириллическая «Ш», и гадай, какой тут код ставить.

Можно сделать аргументы, изменяющие интерепретицию символов в зивисимости от языка (ну, я там не знаю, \cyr\ua{lis}, например). В частности, это помогло бы указывать национальные варианты символов, например, разницу между китайскими и японскими иероглифами.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 15, 2011, 16:39
ЦитироватьПоявится в английском тексте одинокая кириллическая «Ш», и гадай, какой тут код ставить.
Обычно американцы не отличают кириллицу от русского алфавита.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 15, 2011, 16:43
Цитата: Hellerick от октября 15, 2011, 16:34
Появится в английском тексте одинокая кириллическая «Ш», и гадай, какой тут код
ставить.
а) Во-первых, такие случаи сравнительно редки. Обычно всё-таки язык известен.
б) Даже одинокая кириллическая ш может выглядеть по-разному, если она курсивная. Язык не будет лишним.

А вообще, я предлагаю комбинировать подходы:
\eng{The letter <i>\cyrl{sh}</i> is usually trasncribed...} (если речь именно о кириллице)

\eng{The word <i>\bel{kachan'nie...}</i>...} (может быть отображено и кириллицей, и латиницей, в зависимости от предпочтений читателя)

Да, проблема будет с WYSIWIG-редакторами и конверторами из уникода в наш код. Но, с другой стороны, в старых кодировках была проблема с кодированием беты и эсцета одинаково—и ничего, вручную-таки правили.

Ну, и при автоматической конвератции можно всего использовать \cyrl{} и не мучаться.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 15, 2011, 16:47
ЦитироватьНо, с другой стороны, в старых кодировках была проблема с кодированием беты и эсцета одинаково—и ничего, вручную-таки правили.
Можно и автоматизировать. Например, если рядом с «бетой» стоит латинская буква, то это ß, иначе — β. Впрочем, там еще загвоздка с математическими формулами, в которых ß не бывает...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Квас от октября 15, 2011, 16:47
Цитата: Hellerick от октября 15, 2011, 16:34
(ну, я там не знаю, \cyr\ua{lis}, например)

Или \сyr[ua]{lis}.

Транслит — это очень классный способ хранения текста (например, beta code тот же). Обработку и вывод тоже можно сделать какие угодно (например, сделать для ТеХа шрифты с поддержкой румынских письмён и ваять прекрасные документы). Но писать транслитом? :o
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 15, 2011, 16:48
Ах, да, мне видится такая система. Каждый шрифт—программный модуль (типа DLL/shared library). Функции довольно низкоуровневые (получить выосоту для строки, отрисовать строку...). Это позволит потом дополнять систему египетскими иероглифами, например, без внесения существенных изменений.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 15, 2011, 16:49
Цитата: Квас от октября 15, 2011, 16:47
Но писать транслитом?
А в чём собственно проблема? Не Вы ли предлагали Тойво писать тайский транслитом?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Тайльнемер от октября 15, 2011, 16:57
Цитата: Demetrius от октября 15, 2011, 16:48
Каждый шрифт—программный модуль (типа DLL/shared library)
Появятся шрифтовирусы...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 15, 2011, 17:00
Цитата: Demetrius от октября 15, 2011, 15:58
Цитата: Hellerick от октября 15, 2011, 15:22
Вообще, я думаю, нужно делать не Юникод, а «язык универсальной разметки символов», который позволит в ASCII строках кодировать любые символы. В том числе и средствами стандартизированной транслитерации. Например, слово «символ» могло бы в нем кодироваться как «\cyr{simvol}».
Это не интересно. Такая разметка у каждого будет своя. Мне, например, было бы удобнее кодировать иероглифы кродами ЦанЦзе (например, \cj{hqi bbpe ino}), а кому-то будет удобнее что-то другое...
Так а **** *** вы **********???
Сделаймы стандарт, поддерживающий несколько различных более-менее стандартных способов, команд, транслитов. А в расширение вбубениваем либо как в тексе -- пользовательские подлючамые пакеты, либо настраиваемый компилятор, выдающий на ваш подогнанный под личные выпендрёжи код нормальный стандартный код.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 15, 2011, 17:03
Цитата: Demetrius от октября 15, 2011, 16:48
Ах, да, мне видится такая система. Каждый шрифт—программный модуль (типа DLL/shared library).
И сделать шревты платформозависимыми? Нафиг, нафиг!!!
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 15, 2011, 17:09
Цитата: Demetrius от октября 15, 2011, 16:43
(может быть отображено и кириллицей, и латиницей, в зависимости от предпочтений читателя)

Не дай бог! Что это за кодировка такая, если она не обеспечивает однозначного перевода своего кода в строку символов, а начинает изучать «предпочтения читателей»?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 15, 2011, 17:29
Короче оптимальный вариант -- сношать почту Юникода.
Они на потыкивания от частных лиц как, интересно,-- реагируют?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 15, 2011, 18:54
Цитата: Oleg Grom от октября 15, 2011, 17:03
Цитата: Demetrius от октября 15, 2011, 16:48
Ах, да, мне видится такая система. Каждый шрифт—программный модуль (типа DLL/shared library).
И сделать шревты платформозависимыми? Нафиг, нафиг!!!
+1.
Средства отображения символов должны быть портабельными. И еще было бьі неплохо дополнить их неким глобальным репозиторием, из которого автоматически подгружались бы отсутствующие в системе шрифты, таблицы транслитерации и т.п.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 15, 2011, 19:06
Цитата: Hellerick от октября 15, 2011, 16:03
Каждой системе письменности полагается иметь свой код и правила интерпретации его параметров. Желательно, чтобы эти правила были максимально подобны друг другу.
можно использовать языковые коды тупо. А уж для конкретного языка всегда можно соорудить единые непротиворечивые правила.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 15, 2011, 20:31
(http://upload.wikimedia.org/wikipedia/commons/0/0e/Serbian_Cyrillic_Italic.svg)

lang:rus vs lang:srp
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Квас от октября 15, 2011, 21:43
Цитата: Demetrius от октября 15, 2011, 16:49
Цитата: Квас от октября 15, 2011, 16:47Но писать транслитом?
А в чём собственно проблема? Не Вы ли предлагали Тойво писать тайский транслитом?

Когда привыкаешь к графической системе так, что она «в крови», пользоваться транслитом — издевательство. Например, русский транслит не выношу. Несколько другой пример — математика в ТеХе: как известно, этот typesetting engine позволяет высококлассно набирать формулы, но в исходном коде они абсолютно нечитаемы (если речь о чём-то более сложном, чем a+b=c). Поэтому приходится либо смириться с тем, что работаешь вслепую, либо искать другие решения: например, редакторы, которые обеспечивают визуальный ввод формул.

С Тойво так: я не думаю, что тайскую письменность он собирается осваивать на уровне русской и даже вряд ли на уровне английской; набирать же наверняка приходится только пару слов раз в пятилетку. В такой ситуации транслит уместен. Кроме того, мой скрипт позволяет получать аутпут одновременно с печатанием.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Квас от октября 15, 2011, 21:45
Язык важен для внешнего вида символов: ещё один пример — умлауты в немецком сидят сравнительно низко.

Есть ещё всякие типографские конвенции, которые неплохо бы учитывать: например, в режиме французского языка TeX автоматически использует French spacing.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 16, 2011, 05:20
Цитата: Квас от октября 15, 2011, 21:43
Когда привыкаешь к графической системе так, что она «в крови», пользоваться транслитом — издевательство.

Лично я подразумевал, что обычная работа с текстом должна быть в WYSIWYG режиме, с привычными для вашей крови системами ввода.

Транслитный же код будет позволять редактировать текст в том числе и в случае технической недоступности специфических шрифтов, IME и интерпретаторов Лингвокода.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Квас от октября 16, 2011, 13:37
Если дело касается русского или даже древнегреческого с политоникой, то проблем нет: WYSIWYG или нет, но благодаря юникоду есть возможность видеть текст как он есть.

А если юникод не помогает, как в случае с сабжем или церковнославянским? Для последнего HIP является опробованной и всех устраивающей кодировкой; можно представить, что HIP-текст красиво обрабатывается для вывода на печать (что действительно можно делать в ворде или ТеХе), но работать с исходниками типа
Гд\сь просвjьще'нiе мое` и= сп~си'тель мо'й
как-то не очень.

Для себя я различаю «вводимый текст», «хранимый текст» и «текст для печати». Что делать с «вводимым», если юникод не решение, а хочется видеть перед собой нечто похожее на текст? Наверно, костыли придумывать: например, вводить настоящую ять, которая преобразуется в HIP «jь».
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 09:40
Цитата: Hellerick от октября 15, 2011, 17:09
Цитата: Demetrius от октября 15, 2011, 16:43
(может быть отображено и кириллицей, и латиницей, в зависимости от предпочтений читателя)

Не дай бог! Что это за кодировка такая, если она не обеспечивает однозначного перевода своего кода в строку символов, а начинает изучать «предпочтения читателей»?
Никакая не обеспечивает. Что значит &laquo;однозначного&raquo;? Уникод вон, как Bhudh показал, неоднозначен. Более того, даже такая банальная вещь, как e с &laquo;огоньком&raquo; (как там его правильно положено называть?) по-разному должна выглядеть в польском и средневековой латыни (читал в описании какого-то шрифта, кажется, Junicode или Cardo, не помню). Какая попадется&mdash;зависит только от случая.

А мне кажется, что кодировка, которая позволяет представить себя в нужном виде&mdash;правильная кодировка.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 09:43
Цитата: Oleg Grom от октября 15, 2011, 17:03
Цитата: Demetrius от октября 15, 2011, 16:48
Ах, да, мне видится такая система. Каждый шрифт—программный модуль (типа DLL/shared library).
И сделать шревты платформозависимыми? Нафиг, нафиг!!!
Они и так платформеннозависимы.

Ну, можно хранить в байткоде, если Вам так нравятся кактусы. :donno:
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 17, 2011, 12:46
Цитата: Demetrius от октября 17, 2011, 09:40
А мне кажется, что кодировка, которая позволяет представить себя в нужном виде&mdash;правильная кодировка.
Правильная кодировка — та, которая позволяет «писателю» быть уверенным в том, что «читатель» видит именно то, что он имел в виду.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 17, 2011, 13:06
Цитата: Demetrius от октября 17, 2011, 09:43
Они и так платформеннозависимы.
times-new-roman.dll - это платформонезависимо? Как мне это использовать в linux\mac os x?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 17, 2011, 13:19
Цитата: Oleg Grom от times-new-roman.dll
Штоэта⁈
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 17, 2011, 13:22
Цитата: Bhudh от октября 17, 2011, 13:19
Штоэта⁈
Гипотетическая реализация шревтов в виде shared library.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 15:38
Цитата: Oleg Grom от октября 17, 2011, 13:06
Цитата: Demetrius от октября 17, 2011, 09:43
Они и так платформеннозависимы.
times-new-roman.dll - это платформонезависимо?
Во-первых, где я такое заявлял?

Во-вторых, растеризатор TT/PS—тоже платформа.

Цитата: Oleg Grom от октября 17, 2011, 13:06
Как мне это использовать в linux\mac os x?
Запросто. Сам формат PE достаточно просто реализуется. Пробемы с запуском Windows-ных DLL в Linux и MacOS не из-за формата, а из-за API. Если в шрифте не будут вызываться функции библиотек Windows, а только функции шрифтового фреймворка, то переносимость отличаная. Проблемы будут только с неинтелловскими архитектурами, но уже даже маки перешли.

На худой конец, а кто говорил, что обязательно использовать PE? Можно распространять в виде исходных кодов и комплировать в PE/ELF/etc. при установке шрифта (вариант: для новых шрифтов при перестройке кеша fontconfig'а).
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 15:41
Цитата: Hellerick от октября 17, 2011, 12:46
Цитата: Demetrius от октября 17, 2011, 09:40
А мне кажется, что кодировка, которая позволяет представить себя в нужном виде&mdash;правильная кодировка.
Правильная кодировка — та, которая позволяет «писателю» быть уверенным в том, что «читатель» видит именно то, что он имел в виду.
А если писатель имеет в виду сербский текст, а то, кириллицей он или латиницей, ему безразлично?

Различие между кириллицей и латиницей по сути такое же, как и между курсивной и обычной буквой "а": обе несут один смысл. Кодировать надо смысл, а не внешнее представление.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 15:52
Србский език латинкој извињен мрти.
Или как то так.
В любом случае у нас будут свои собственные шрифты, с блэкджэком и лингвошлюхами. Потому как ныне существующие шрифты не позволяют красиво и адекватно набрать даже простенький немецкий текстик в традиционной типографике.
Короче уже опять Латекс получился. Ещё б не надо было этот зоопарк с кодировками разводить. Всё собираюсь Ксетекс разобрать, но и он вроде как болен.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 16:04
Цитата: Искандер от октября 17, 2011, 15:52
Србский език латинкој извињен мрти.
А сербы об этом в курсе?

Цитата: Искандер от октября 17, 2011, 15:52В Потому как ныне существующие шрифты не позволяют красиво и адекватно набрать даже простенький немецкий текстик в традиционной типографике.
Linux Libertine (http://www.linuxlibertine.org/)? Вроде ж немец делал, там есть специятельные опции для немецких умляутов, специальная буква Т для немецкого и даже заглавный эсцет для написания заглавными буквами. Да, и капитель там тоже есть, правильная.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 16:30
А дефис немецкий там есть, а косые дроби, а курсивная дэ в разных вариантах?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Python от октября 17, 2011, 16:33
Цитата: Demetrius от октября 17, 2011, 15:41
А если писатель имеет в виду сербский текст, а то, кириллицей он или латиницей, ему безразлично?

Различие между кириллицей и латиницей по сути такое же, как и между курсивной и обычной буквой "а": обе несут один смысл. Кодировать надо смысл, а не внешнее представление.
Не всегда и не везде. Если взять, например, крымскотатарский, там кириллица и латиница представляют собой два правописания, каждое из которых страдает от невозможности передачи тех или иных звуков, отображаемых графически в другом.

Было бы неплохо различать транслитерацию для «абстрактной письменности», которая может определяться пользователем или параметрами текста, и транслитерацию для конкретных кириллицы или латиницы. Хотя, вообще, делать ставку на настройки пользователя — снизить перносимость файлов. Впрочем, желательно все же обеспечить совместимость между транслитом для различных графических систем одного языка, чтобы кириллица, латиница и т.д. отличались в исходниках лишь ключевым словом.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 16:55
Цитата: Искандер от октября 17, 2011, 16:30
А дефис немецкий там есть, а косые дроби, а курсивная дэ в разных вариантах?
:donno:
Проверьте, скажете.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 18:15
Цитата: Demetrius от октября 17, 2011, 16:55
:donno:
Проверьте, скажете.
Ес чо их кокбэ нет в Юникоде.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 18:18
Цитата: Demetrius от октября 17, 2011, 16:55
Проверьте, скажете.
Я чот не понЯл, як его в ЛаТекс установить этой шрихт —?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 17, 2011, 18:21
Можно попробовать сделать пробную версию Лингвокода в Лингвовики. По командам типа {{LC|cyr|p|r|i|m|e|r}} из нужных шрифтов будут доставаться нужные символы, а если их не хаватает, то и графические изображения.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 18:23
Цитата: Demetrius от октября 17, 2011, 16:55
Проверьте, скажете.
Я вам сразу скажу: вот это их Ö никуда не годится.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 18:24
Цитата: Искандер от октября 17, 2011, 18:15
Цитата: Demetrius от октября 17, 2011, 16:55
:donno:
Проверьте, скажете.
Ес чо их кокбэ нет в Юникоде.
Как бы есть OTF с разными символами в зависимости от языка и прайвит юз.

По-моему, для либертины перестали делать латеховую версию всвязи с отсутствием необходимости, и предлагают использовать ксетекс.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 18:25
Цитата: Искандер от октября 17, 2011, 18:23
Цитата: Demetrius от октября 17, 2011, 16:55
Проверьте, скажете.
Я вам сразу скажу: вот это их Ö никуда не годится.
А у вас оно немецкое или французское? Там есть два штука. Немецкое на мой вкус странное (там точки слишком близко к букве), но делал немец, ему виднее. :donno:
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 18:27
Цитата: Hellerick от октября 17, 2011, 18:21
Можно попробовать сделать пробную версию Лингвокода в Лингвовики. По командам типа {{LC|cyr|p|r|i|m|e|r}} из нужных шрифтов будут доставаться нужные символы, а если их не хаватает, то и графические изображения.
Я, кстати, втихаря паяю свою версию. Если будет не лень... Давайте их как-нибудь разграничим, а? У меня ЛингвоКод Добро, у Вас ЛингвоКод Хер У меня LingvoCode-D, у Вас LingvoCode-H?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 18:27
А их эти Ҳҳ, ҟ, Ҩҩ, ҵ и Ҿҿ делают меня хотеть крови.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 18:28
Цитата: Demetrius от октября 17, 2011, 18:24
прайвит юз.
издеваетесь?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 18:29
Цитата: Demetrius от октября 17, 2011, 18:25
(там точки слишком близко к букве), но делал немец, ему виднее.
То где точки раздристаны в стороны? Немец — не немец, а типограф он никакой.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 18:29
Зато Ять прекрасна, ять в восхищении!
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 17, 2011, 18:29
Цитата: Demetrius от октября 17, 2011, 18:27
Я, кстати, тоже втихаря паяю свою версию.
Поподробнее, пліз.
Пайкой какого рода вы занимаетесь?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 18:31
Цитата: Искандер от октября 17, 2011, 18:27
А их эти Ҳҳ, ҟ, Ҩҩ, ҵ и Ҿҿ делают меня хотеть крови.
Видимо, делали люди, никогда их в глаза не видевшие. :donno: ОпенСорс прожект, можете нарисовать свои.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 18:44
Цитата: Hellerick от октября 17, 2011, 18:29
Цитата: Demetrius от октября 17, 2011, 18:27
Я, кстати, тоже втихаря паяю свою версию.
Поподробнее, пліз.
Пайкой какого рода вы занимаетесь?
Я начал писать мини-редактор типа &laquo;Блокнота&raquo;, для Windows, в котором внутренним представлением будет LingvoCode-D. Вывод будет (для начала) производиться банальным преобразованием в уникод и вызовом DrawTextW.

Делаю под Windows, ибо хочу в будущем определять тип кириллицы (RUS, BEL, UKR) в зависимости от системной раскладки, а в Линуксе ее определение&mdash;слишком сложная для меня задача.

Но для начала я хочу сделать универсальные {Cyrl}, {Latn}, а варианты для отдельных языков сделаю потом.

Синтаксис у меня&mdash;полнейший волюнтаризм и неучет общественного мнения будет примерно такой:
{Cyrl} Kyryllyca {Latn} Latin

Пока что сделал очень мало, сейчас нет времени особо (у компьютера я только вечером), но, думаю, до выходных доделаю.

Единственное, что меня волнует: такой код несовместим с ASCII. То есть ASCII "{}" = LC-D "{(}{)}". Это нехорошо, но выхода не вижу.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Oleg Grom от октября 17, 2011, 18:44
Ну вот так всегда. Вроде бы годный шрифт, но с румыницей не дружит :( Хорошо хоть юсы с ятями в шрифтах нынче не редкость.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 18:44
Цитата: Demetrius от октября 17, 2011, 18:31
Видимо, делали люди, никогда их в глаза не видевшие. :donno: ОпенСорс прожект, можете нарисовать свои.
Давненько мечтаю отрисовать собственный шрифт вообще-то говоря...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Bhudh от октября 17, 2011, 19:00
Цитата: Demetrius от Видимо, делали люди, никогда их в глаза не видевшие.
Что очень странно.
При приёме в таблицу Уникода буквы предоставляют аутентичные нотариально заверенные сканы с факсимиле. Маст ред для шрифтмахеров тащьта.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 19:03
Цитата: Bhudh от октября 17, 2011, 19:00
Цитата: Demetrius от Видимо, делали люди, никогда их в глаза не видевшие.
Что очень странно.
При приёме в таблицу Уникода буквы предоставляют аутентичные нотариально заверенные сканы с факсимиле. Маст ред для шрифтмахеров тащьта.
Ну так в тех факсимилях другая гарнитура. Приспособили под свою, но утратили естественный вид. Что тут странного?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Hellerick от октября 17, 2011, 19:06
Цитата: Demetrius от октября 17, 2011, 18:44
Единственное, что меня волнует: такой код несовместим с ASCII. То есть ASCII "{}" = LC-D "{(}{)}". Это нехорошо, но выхода не вижу.

А так, чтобы он реагировал имключительно на фигурные скобки, содержащие строго заданный набор ключевых слов, сделать нельзя? Тогда случаи несовместимости будут сведены к минимуму.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 19:08
Цитата: Demetrius от октября 17, 2011, 19:03
Ну так в тех факсимилях другая гарнитура. Приспособили под свою, но утратили естественный вид. Что тут странного?
Учитывая, что сама по себе отрисовка шрифта — дело очень трудоёмкое, весьма странно наблюдать такую халатность и нежелание потратить полтора процента времени на ознакомление с естественным видом отрисовываемых ълифов.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Demetrius от октября 17, 2011, 19:12
Цитата: Hellerick от октября 17, 2011, 19:06
Цитата: Demetrius от октября 17, 2011, 18:44
Единственное, что меня волнует: такой код несовместим с ASCII. То есть ASCII "{}" = LC-D "{(}{)}". Это нехорошо, но выхода не вижу.

А так, чтобы он реагировал имключительно на фигурные скобки, содержащие строго заданный набор ключевых слов, сделать нельзя? Тогда случаи несовместимости будут сведены к минимуму.
Можно, но не нужно. Потому что тогда появится еще и никак не детектируемая несовместимость версий. А так хотя бы можно покрасить неизвестную кодировку красным и вывести транслит.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Квас от октября 17, 2011, 19:48
К вопросу об умлаутах: в немецком языке они сидят низко, так и задумано.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Квас от октября 17, 2011, 19:53
Цитата: Demetrius от октября 17, 2011, 18:44
Я начал писать мини-редактор типа «Блокнота», для Windows, в котором внутренним представлением будет LingvoCode-D. Вывод будет (для начала) производиться банальным преобразованием в уникод и вызовом DrawTextW.

Мне кажется, эту вещь можно будет хорошо использовать для LuaTeXа, когда он будет пригоден к употреблению. Можно и для всякого другого TeXа, но тогда предварительную обработку файлов придётся производить отдельно.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 19:54
Цитата: Квас от октября 17, 2011, 19:48
К вопросу об умлаутах: в немецком языке они сидят низко, так и задумано.
Про шрифтоустановку не подскажете?
Пошукаю за умляуты. Шведы точно не заморачиваются и ставят вгору стандартный диерезис, хотя видимо и не столь сильны традициями, но пережили они золотой век дизайна и это не могло не сказаться на шривтах в том числе.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Квас от октября 17, 2011, 19:55
Цитата: Искандер от октября 17, 2011, 19:54
Цитата: Квас от октября 17, 2011, 19:48К вопросу об умлаутах: в немецком языке они сидят низко, так и задумано.
Про шрифтоустановку не подскажете?

Чево?
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 19:56
Цитата: Квас от октября 17, 2011, 19:55
Чево?
В "Компутары->Вокруг ТеХа"
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Квас от октября 17, 2011, 19:58
Цитата: Искандер от октября 17, 2011, 19:56
Цитата: Квас от октября 17, 2011, 19:55Чево?
В "Компутары->Вокруг ТеХа"

Так уже.
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Искандер от октября 17, 2011, 19:59
ааа, это я торможу.
спать пора...
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Квас от октября 17, 2011, 20:14
Спокойной ночи. :)
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: DarkMax2 от июля 27, 2017, 10:44



Привѣ ѫн заре кум пе мърй
Ръсаре ши стрълуче,
Пе мишкътоареле кърърй
Коръбий негре дуче.

Ѫл веде азй, ѫл веде мѫни,
Астфел доринца-й гата;
Ел йар, привинд де съптъмѫнй,
Ѫй каде драгъ фата.

Кум ѣ пе коате-шй ръзима
Висѫнд але ей тѫмпле,
Де дорул луй ши инимa
Ши суфлету-й се ѫпле.
Privea în zare cum pe mări
Răsare şi străluce,
Pe mişcătoarele cărări
Corăbii negre duce.

Îl vede azi, îl vede mâni,
Astfel dorinţa-i gata;
El iar, privind de săptămâni,
Îi cade dragă fata.

Cum ea pe coate-şi răzima
Visând ale ei tâmple,
De dorul lui şi inima
Şi sufletu-i se împle.

Гарно :)
Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: Ion Borș от июля 27, 2017, 13:39
Цитата: DarkMax2 от июля 27, 2017, 10:44
Гарно :)
:yes:



Привя ѫн заре кум пе мэрь
Рэсаре ши стрэлуче,
Пе мишкэтоареле кэрэрь
Корэбий негре дуче.

Ыл веде азь, ыл веде мыне,
Астфел доринца-й гата;
Ел яр, привинд де сэптэмынь,
Ый каде драгэ фата.

Кум я пе коате-шь резема
Висынд але ей тымпле,
Де дорул луй ши инимa
Ши суфлету-й се ымпле.
Privea în zare cum pe mări
Răsare şi străluce,
Pe mişcătoarele cărări
Corăbii negre duce.

Îl vede azi, îl vede mâne,
Astfel dorinţa-i gata;
El iar, privind de săptămâni,
Îi cade dragă fata.

Cum ea pe coate-şi rezema
Visând ale ei tâmple,
De dorul lui şi inima
Şi sufletu-i se împle.

Название: [ПлачЪ] румынская кириллица и юникод.
Отправлено: DarkMax2 от июля 27, 2017, 16:02
Мені чомусь я не подобається в неслов'янських мовах.