Лингвофорум

Лингвоблоги => Личные блоги => Oleg Grom => Topic started by: Oleg Grom on October 8, 2011, 23:34

Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 8, 2011, 23:34
Чего только нет в кириллической части юникода. Можно даже найти символы алфавивитов, употреблявшихся чуть ли не для нескольких письменных памятников. Для исторической кириллицы предусмотрены всякие зеркальные начертания, глазастые О и еще куча всякого не особо нужного хлама. Но вот для буквы ю с краткой, употреблявшейся несколько столетий, места видите ли не нашлось. Ладно бы была краткая в качестве комбинируещего диакритика, так нету ее. Приходится использовать костыли в виде ю + combining breve. Но во многих шрифтах краткая и бревис рисуются по-разному  >( Не говоря уже о том, что в большинстве шрифтов комбинирующие диакритики безбожно плывут (см. вложение: шрифты times new roman и old standard). Доколѣ!?

Также неплохо было бы иметь соответствующие символы для і̆ (і с краткой) и ꙋ̆ (гаммообразный ук с краткой), использовавшихся в в поздней кириллице. Для инициальных е, з, о место в юникоде нашлось, но почему бы не добавить еще и "широкое с" (актуально не только для румыницы, но и для западнорусских (украинских) изданий 17-19 вв.). Ну и предел мечтаний - лигатурное іꙋ для некоторых форм поздней румынской кириллицы и переходных алфавитов.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: I. G. on October 8, 2011, 23:35
[ПлачЪ]
Вот и Вы поддались искушению.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 13, 2011, 20:11
Посмотрел список символов, принятых в юникод: http://www.unicode.org/alloc/Pipeline.html
С кириллицей все как обычно печально.
Вот какова реальная польза от этого?
Quote
CYRILLIC CAPITAL LETTER DOUBLE O
CYRILLIC SMALL LETTER DOUBLE O
CYRILLIC CAPITAL LETTER CROSSED O
CYRILLIC SMALL LETTER CROSSED O

Ю с краткой используется в казымском и шурышкарском диалектах хантыйского языка. Интересно их в юникод кто-нибудь собирается продвигать? Все, что нагуглил на эту тему: (wiki/ru) Википедия:Проект:Внесение_символов_алфавитов_народов_России_в_Юникод#Алфавиты_народов_Западной_Сибири (http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%9F%D1%80%D0%BE%D0%B5%D0%BA%D1%82:%D0%92%D0%BD%D0%B5%D1%81%D0%B5%D0%BD%D0%B8%D0%B5_%D1%81%D0%B8%D0%BC%D0%B2%D0%BE%D0%BB%D0%BE%D0%B2_%D0%B0%D0%BB%D1%84%D0%B0%D0%B2%D0%B8%D1%82%D0%BE%D0%B2_%D0%BD%D0%B0%D1%80%D0%BE%D0%B4%D0%BE%D0%B2_%D0%A0%D0%BE%D1%81%D1%81%D0%B8%D0%B8_%D0%B2_%D0%AE%D0%BD%D0%B8%D0%BA%D0%BE%D0%B4#.D0.90.D0.BB.D1.84.D0.B0.D0.B2.D0.B8.D1.82.D1.8B_.D0.BD.D0.B0.D1.80.D0.BE.D0.B4.D0.BE.D0.B2_.D0.97.D0.B0.D0.BF.D0.B0.D0.B4.D0.BD.D0.BE.D0.B9_.D0.A1.D0.B8.D0.B1.D0.B8.D1.80.D0.B8)
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Dana on October 13, 2011, 20:29
Ну и предел мечтаний - лигатурное іꙋ
Лигатурное что?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: autolyk on October 13, 2011, 20:32
Лигатура и десятеричного и ука.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 13, 2011, 20:46
Лигатура и десятеричного и ука.
Оно самое. Выглядело как-то так.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: autolyk on October 13, 2011, 20:48
Интересно, а эта лигатура где-то реально использовалась?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 13, 2011, 20:58
Интересно, а эта лигатура где-то реально использовалась?
Конечно. Например, вотЪ:
http://books.google.com/books?id=JTsQAAAAYAAJ&pg=PT426#v=onepage&q&f=false
http://books.google.ro/books?id=kvgRAAAAYAAJ&pg=PA111#v=onepage&q&f=false

В переходных алфавитах ее использовали довольно последовательно.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: autolyk on October 13, 2011, 21:06
Спасибо, действительно интересно.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Vertaler on October 13, 2011, 22:04
Так это, вроде бы, кто подавал петицыю, того и гешефт. Последний блок копирует петицию какого-то чувака с красивой еврейской фамилией.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Тайльнемер on October 14, 2011, 07:47
Но вот для буквы ю с краткой, употреблявшейся несколько столетий, места видите ли не нашлось. Ладно бы была краткая в качестве комбинируещего диакритика, так нету ее. Приходится использовать костыли в виде ю + combining breve. Но во многих шрифтах краткая и бревис рисуются по-разному  (" title=">(" border="0" class="smiley"> Не говоря уже о том, что в большинстве шрифтов комбинирующие диакритики безбожно плывут
Как всегда, рулит Cambria. Тут и форма дужки нужная, и позиция:
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Тайльнемер on October 14, 2011, 07:57
То, что уникодовцы не захотели различать бревис и кратку — это, конечно, нехорошо, но камбрия различает их по блокам — кратка всегда используется для кириллических букв.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 14, 2011, 12:18
А у Вас что за камбрия?
Моя Version 5.96 так не умеет…

Upd.: А, нет, умеет, но только в Ворде. В BabelPadʼe как-то % на 10…
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 14, 2011, 15:41
Как всегда, рулит Cambria.
Рулит, но не для румынского. Ибо нет буквы ꙟ, ꙗ, гаммаобразного ука и много еще чего, а подставленная из других шрифтов выглядит неайс. Да и специфическая диакритика мягко говоря "плывет". Old Standard во всем кроме ю̆ предпочтительней. Ну и мой самопал подходит, естественно :)

Хали́па алека́се ла Ѹ̑ниверсита́тѣ дин Ꙗ҆́шй шѝ се па́ре къ лꙋ́птеле є̑лектора́ле върса́серъ дин белшꙋ́г деꙁнъде́жде ꙟ̑ сꙋ́флетꙋл че́лѡр ка́ре ръмъсе́серъ ла Кишинъ́ꙋ. І̑еромона́хꙋл Гꙋ́рїе а типъри́т ѹ̑шо́р ка́ртѣ Ꙟ̑въцътꙋ́ра де́спре ле́џѣ лꙋй Дм҃нꙁе́ꙋ, ꙟ̑ а҆́нꙋл ҂ац҃и; ма́й а̑нево́е, ꙟ̑съ, въꙁꙋ̀ типа́рꙋл а̑до́ѡа ка́рте, ка́ре нꙋ а̑вѣ̀ дꙋ́пъ пъръ́рѣ кондꙋкъто́рилѡр бисѣриче́щй, ни́чй ѡ̑ легътꙋ́ръ кꙋ вїѧ́ца релиџїо́асъ.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Валентин Н on October 14, 2011, 15:54
Камбрия справляется с многоэтажной диакритикой, но не справляется смногоэтажными подстрочниками...
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: DarkMax2 on October 14, 2011, 16:13
Лигатура и десятеричного и ука.
Оно самое. Выглядело как-то так.
Красиво.

Cambria, конечно, рулит. А Юникод всё таки не шрифт, чтобы всё это от него требовать.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: I. G. on October 14, 2011, 16:14
Ибо нет буквы ꙟ, ꙗ,
И видишь 2 квадрата...
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 14, 2011, 16:18
А Юникод всё таки не шрифт, чтобы всё это от него требовать.
Но могли бы хоть какие-то стандартные шрифты распространять для своего стандарта. А так с момента ввода символа в юникод до момента, когда он появится в общедоступных шрифтах, лет пять приходится квадратиками любоваться.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: lehoslav on October 14, 2011, 16:21
И видишь 2 квадрата...

Я только один :eat:
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 14, 2011, 16:24
А Юникод всё таки не шрифт, чтобы всё это от него требовать.
Как раз-таки это проблема юникода. Бреве и краткая - это все-таки разные знаки и они должны различаться на уровне стандарта. То что в делают на уровне шрифтов - это костыли. Позиционные варианты букв, конечно можно сделать средствами шрифта. Все-таки ѻ\о, з\ꙁ, є\е, широкое\обычное "с" - это варианты одной буквы, а их разнесение по разным кодам только мешает, например, при поиске по тексту. Но раз уже начали городить костыли с выделением места под "исторические" начертания, то неплохо сделать бы это все последовательно и до конца
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 14, 2011, 16:28
И видишь 2 квадрата...
(wiki/ru) Ꙟ (http://ru.wikipedia.org/wiki/%EA%99%9E) и (wiki/ru) Ꙗ (http://ru.wikipedia.org/wiki/%EA%99%96)

А так с момента ввода символа в юникод до момента, когда он появится в общедоступных шрифтах, лет пять приходится квадратиками любоваться.
Есть же проект (универсалия, кажется, называется), где охвачен весь юникод.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 14, 2011, 16:31
Я так понимаю, всё идет к тому, что мы тут начнем составлять собственный LINGVOCODE?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: DarkMax2 on October 14, 2011, 16:32
Почему это кратка и бреве разные знаки? Это начертания одного знака.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 14, 2011, 16:35
Почему это кратка и бреве разные знаки? Это начертания одного знака.

Предлагаете объединить коды похожих символов латиницы и кириллицы?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 14, 2011, 16:42
Почему это кратка и бреве разные знаки? Это начертания одного знака.
Исторически разные. И вообще, имхо плохая идея, делать общую дакритику для латиницы и кириллицы. Для греческого же выделили отдельные кодовые позиции для их надстрочных закорючек.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: DarkMax2 on October 14, 2011, 16:42
Почему это кратка и бреве разные знаки? Это начертания одного знака.

Предлагаете объединить коды похожих символов латиницы и кириллицы?
Можно было бы, но у них значения разные, так что нет, а кратка и бреве имеют один смысл.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 14, 2011, 16:49
Почему это кратка и бреве разные знаки? Это начертания одного знака.

Предлагаете объединить коды похожих символов латиницы и кириллицы?
Можно было бы, но у них значения разные, так что нет, а кратка и бреве имеют один смысл.

И чем отличаются значения латинской, кириллической и греческой О?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: DarkMax2 on October 14, 2011, 16:50
Ну я про Р, например, говорил.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 14, 2011, 16:54
А так с момента ввода символа в юникод до момента, когда он появится в общедоступных шрифтах, лет пять приходится квадратиками любоваться.
Есть же проект (универсалия, кажется, называется), где охвачен весь юникод.
В Универсалии присутствуют некоторые ошибки (например, начертание некоторых букв глаголицы не соответствует коду). Это не стандарт, а всего лишь еще один любительский шрифт, и с момента появления символа в стандарте до появления его в шрифте тоже проходит некоторое время.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 14, 2011, 18:22
В Универсалии присутствуют некоторые ошибки (например, начертание некоторых букв глаголицы не соответствует коду).
Автор вроде писал, что починил это дело в августе.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 14, 2011, 20:10
Автор вроде писал, что починил это дело в августе.
Вроде сейчас все нормально.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Валентин Н on October 14, 2011, 20:20
Чо-чо? Существует шрифт содержащий весь юникод???
Или я не так понял? сколько весит.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 14, 2011, 20:25
Чо-чо? Существует шрифт содержащий весь юникод???
Или я не так понял? сколько весит.
Мы ж про него и говорим. Полная поддержка юникоде 6.0 - http://magazeta.com/soft/2011/02/12/universalia-font/
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Валентин Н on October 14, 2011, 21:13
Мы ж про него и говорим. Полная поддержка юникоде 6.0 - http://magazeta.com/soft/2011/02/12/universalia-font/
Как вы думаете, если я щас все шрифты удалю и оставлю только те 2, что будет с лфом?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Wulfila on October 14, 2011, 21:21
Quote from: Валентин Н
Как вы думаете, если я щас все шрифты удалю и оставлю только те 2, что будет с лфом?
что за угрозы?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 14, 2011, 21:23
Как вы думаете, если я щас все шрифты удалю и оставлю только те 2, что будет с лфом?
Если вы удалите на своей машине все шрифты, то думаю форум от этого никак не пострадает.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Валентин Н on October 14, 2011, 21:24
Не, серьёзно - если оставлю только те 2 у меня все символы что есть на лф видны будут?
Хочу провести опыт...
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Валентин Н on October 14, 2011, 21:26
форум от этого никак не пострадает.
"что будет с лф" это метонимия (http://lingvoforum.net/index.php?action=dlattach;topic=26145.0;attach=14536;image)
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 14, 2011, 21:30
Не, серьёзно - если оставлю только те 2 у меня все символы что есть на лф видны будут?
В принципе, если у браузера нет проблем с подстановкой шрифтов, то он подставит какие есть, т.е. универсалию. Но боюсь, операционная система воспримет удаление всех шрифтов, включая системные, не очень адекватно и до входа на ЛФ дело вообще не дойдет.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Валентин Н on October 14, 2011, 23:53
Удалил всё что возможно было.
Шрифт просто песетц, но зато ни единого квадрата...
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Toivo on October 14, 2011, 23:58
но зато ни единого квадрата...
Я аж завидую.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 15, 2011, 00:00
Зачем все удалять? На ЛФ можно в правом верхнем углу выбрать Custom font и вписать Universalia.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 15, 2011, 00:02
Я аж завидую.
Если шрифт установлен в системе, то браузер должен его подставлять сам, там где натыкается на квадраты.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Toivo on October 15, 2011, 00:03
Если шрифт установлен в системе, то браузер должен его подставлять сам, там где натыкается на квадраты.
Попробую скачать.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Валентин Н on October 15, 2011, 00:05
Зачем все удалять? На ЛФ можно в правом верхнем углу выбрать Custom font и вписать Universalia.
чтоб убедиться, что не другие шрифты подставляет
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 15, 2011, 00:12
Удалил всё что возможно было.
Жистока.
А просто перенести из системной папки Fonts в любую другую не судьба была?
Восстановить-то так леххче.

Кстати, а Ваш песетс — это не System случайно?‥
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Toivo on October 15, 2011, 00:14
Попробую скачать.
Установил. Квадратики остались. ЧЯДНТ?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 15, 2011, 00:17
ВНУШВБ.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 15, 2011, 00:18
Не все браузеры так умеют. Плюс еще выбор шрифта может быть не индивидуальным для каждого символа, а поблочно.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Toivo on October 15, 2011, 00:18
ВНУШВБ.
Информативно.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 15, 2011, 00:19
ЧЯДНТ?
Вы пользуетесь оперой :) Обычно у нее бывают проблемы с подстановкой шрифтов.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Валентин Н on October 15, 2011, 00:19
А просто перенести из системной папки Fonts в любую другую не судьба была?
Подразумевалось удаление из папки фонтс.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Toivo on October 15, 2011, 00:20
Не все браузеры так умеют. Плюс еще выбор шрифта может быть не индивидуальным для каждого символа, а поблочно.
Я указал Универсалию в пользовательских шрифтах здесь. Всё равно квадратики. Или это тоже так браузер работает? :donno:
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 15, 2011, 00:20
ВНУШВБ.
Информативно.
ЧЯДНТ?
Не менее.

Вон Python и то понял, что ВыНеУстановилиШрифтыВБраузере.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 15, 2011, 00:21
Еще браузер желательно перезапустить. Опера не видит шрифты, установленные во время текущего сеанса.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Квас on October 15, 2011, 00:21
Я так понимаю, всё идет к тому, что мы тут начнем составлять собственный LINGVOCODE?

;up: И шрифты под него рисовать! :yes:
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Toivo on October 15, 2011, 00:25
Вы пользуетесь оперой
В Фирефоксе вроде работает.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Toivo on October 15, 2011, 00:26
ЧЯДНТ?
Не менее.
Гуглится даже в яндексе.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 15, 2011, 00:28
Можа она и яндицо в гуглице, но общение аббр-ми — неуважение к собеседнику.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Toivo on October 15, 2011, 00:38
ЧЯДНТ?
ЧЯДНТ?
ЧЯДНТ?
ЧЯДНТ?
ЧЯДНТ?
ЧЯДНТ?
ЧЯДНТ?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 15, 2011, 00:49
Так. Поиск постов по опр. юзеру опять не работает! >(
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Квас on October 15, 2011, 00:49
Offtop
ЧА-ЩА пиши с А!
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Валентин Н on October 15, 2011, 14:58
Так. Поиск постов по опр. юзеру опять не работает!
ого, а как это раньше работало?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 15, 2011, 15:52
Можа она и яндицо в гуглице, но общение аббр-ми — неуважение к собеседнику.
:fp:

Аббревиатура аббревиатуре рознь.

Я так понимаю, всё идет к тому, что мы тут начнем составлять собственный LINGVOCODE?

;up: И шрифты под него рисовать! :yes:
Мне кажется, что надо коренным образом пересмотреть подход к китайским шрифтам. Например, хотя бы делать самые частые компоненты комбинируемыми.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 15, 2011, 15:55
Мне кажется, что надо коренным образом пересмотреть подход к китайским шрифтам. Например, хотя бы делать самые частые компоненты комбинируемыми.

А отдельные коды для хангылей вообще в топку?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 15, 2011, 16:03
Мне кажется, что надо коренным образом пересмотреть подход к китайским шрифтам. Например, хотя бы делать самые частые компоненты комбинируемыми.

А отдельные коды для хангылей вообще в топку?
Деванагари же как-то обходится без кодов для лигатур?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 15, 2011, 16:09
Костыли в приватюзе.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 15, 2011, 16:13
Деванагари же как-то обходится без кодов для лигатур?

Ну дык и я об них же.

Помню, еще в 1997 у меня был корейский шрифт, который позволял писать хангыли не смотря на то, что корейские символы занимали лишь верхние 128 позиций кодовой таблицы. Как-то очень умно располагались эти закорючки, что при их наложении друг на друга получались все (?) возможные хангыли. Будь такое имплементировано в Юникоде — столько бы места освободилось!
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 15, 2011, 16:17
Мне кажется, что надо коренным образом пересмотреть подход к китайским шрифтам. Например, хотя бы делать самые частые компоненты комбинируемыми.

А отдельные коды для хангылей вообще в топку?
Насчёт хангылей не уверен. Тут нало внимательное рассмотрение, а то может оказаться, что исторические хангыли ненабирабельны...
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 15, 2011, 16:20
Тут есть три варианта: либо делать фрагментарные символы такой формы, чтобі они хорошо подходили друг другу (но тогда о некоторых шрифтах можно забыть), либо делать готовые глифы с отдельными кодами (либо пользовательские, либо стандантизированные), либо подстановка лигатур вместо последовательностей символов (дополнительные требования к пользовательскому софту).
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 15, 2011, 16:22
Вообще, я думаю, нужно делать не Юникод, а «язык универсальной разметки символов», который позволит в ASCII строках кодировать любые символы. В том числе и средствами стандартизированной транслитерации. Например, слово «символ» могло бы в нем кодироваться как «\cyr{simvol}».
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 15, 2011, 16:25
ТеХовская разметка громоздковата, как и htmlевская. Я раньше пробовал сделать что-то типа универсального транслита с метками переключения транслитерации. Что-то в таком стиле:
&@cyr;tekst tekst tekst &@glag;tekst &@greek;text
должно отображаться как
текст текст текст ⱅⰵⰽⱄⱅ τεξτ
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 15, 2011, 16:31
Я раньше пробовал сделать что-то типа универсального транслита с метками переключения транслитерации.

+1  :)
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 15, 2011, 16:49
\cyr{simvol}
&@cyr;

ТеХовская разметка громоздковата
:what:
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 15, 2011, 16:58
Вообще, я думаю, нужно делать не Юникод, а «язык универсальной разметки символов», который позволит в ASCII строках кодировать любые символы. В том числе и средствами стандартизированной транслитерации. Например, слово «символ» могло бы в нем кодироваться как «\cyr{simvol}».
Это не интересно. Такая разметка у каждого будет своя. Мне, например, было бы удобнее кодировать иероглифы кродами ЦанЦзе (например, \cj{hqi bbpe ino}), а кому-то будет удобнее что-то другое...
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 15, 2011, 17:03
ТеХовская разметка громоздковата, как и htmlевская.

Ну, можно определить, что после того, как была введена метка \cyr, любой текст в фигурных скобках будет интерпретироваться как кириллица, пока не будет введена новая метка. Типа такого:

Code: [Select]
Russian:
\cyr{koshka} = cat
{sobaka} = dog
{xomyachok} = evil monster

Japanese:
\hir{neko} = cat
{inu} = dog

Так что получится негромоздко.

Каждой системе письменности полагается иметь свой код и правила интерпретации его параметров. Желательно, чтобы эти правила были максимально подобны друг другу.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 15, 2011, 17:24
\cyr{simvol}
&@cyr;

ТеХовская разметка громоздковата
:what:
Изначально задумывалось как набор виртуальных символов-переключателей, дополняющих html - отсюда и форма &....;
В html подобным образом кодируется отдельный символ, что для текста, полностью состоящего из таких символов, неудобно. ТеХ ближе к идеалу, но блочная структура имеет смысл лишь при вложении (что в нашем случае не требуется).
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 15, 2011, 17:27
Число символов одынакое…
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 15, 2011, 17:29
Я бы скорее коды для языков. Два очевидных плюса:
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 15, 2011, 17:34
Quote
Я бы скорее коды для языков.
Собственно, я для языков ее и делал. Хотя эту систему можно приспособить для чего-угодно — и для отдельных языков, и для обобщенных графических систем, типа кириллицы или расширенной латиницы.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 15, 2011, 17:34
Я бы скорее коды для языков.

Проблема в том, что языки придется указывать вручную.
Появится в английском тексте одинокая кириллическая «Ш», и гадай, какой тут код ставить.

Можно сделать аргументы, изменяющие интерепретицию символов в зивисимости от языка (ну, я там не знаю, \cyr\ua{lis}, например). В частности, это помогло бы указывать национальные варианты символов, например, разницу между китайскими и японскими иероглифами.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 15, 2011, 17:39
Quote
Появится в английском тексте одинокая кириллическая «Ш», и гадай, какой тут код ставить.
Обычно американцы не отличают кириллицу от русского алфавита.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 15, 2011, 17:43
Появится в английском тексте одинокая кириллическая «Ш», и гадай, какой тут код
ставить.
а) Во-первых, такие случаи сравнительно редки. Обычно всё-таки язык известен.
б) Даже одинокая кириллическая ш может выглядеть по-разному, если она курсивная. Язык не будет лишним.

А вообще, я предлагаю комбинировать подходы:
\eng{The letter <i>\cyrl{sh}</i> is usually trasncribed...} (если речь именно о кириллице)

\eng{The word <i>\bel{kachan'nie...}</i>...} (может быть отображено и кириллицей, и латиницей, в зависимости от предпочтений читателя)

Да, проблема будет с WYSIWIG-редакторами и конверторами из уникода в наш код. Но, с другой стороны, в старых кодировках была проблема с кодированием беты и эсцета одинаково—и ничего, вручную-таки правили.

Ну, и при автоматической конвератции можно всего использовать \cyrl{} и не мучаться.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 15, 2011, 17:47
Quote
Но, с другой стороны, в старых кодировках была проблема с кодированием беты и эсцета одинаково—и ничего, вручную-таки правили.
Можно и автоматизировать. Например, если рядом с «бетой» стоит латинская буква, то это ß, иначе — β. Впрочем, там еще загвоздка с математическими формулами, в которых ß не бывает...
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Квас on October 15, 2011, 17:47
(ну, я там не знаю, \cyr\ua{lis}, например)

Или \сyr[ua]{lis}.

Транслит — это очень классный способ хранения текста (например, beta code тот же). Обработку и вывод тоже можно сделать какие угодно (например, сделать для ТеХа шрифты с поддержкой румынских письмён и ваять прекрасные документы). Но писать транслитом? :o
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 15, 2011, 17:48
Ах, да, мне видится такая система. Каждый шрифт—программный модуль (типа DLL/shared library). Функции довольно низкоуровневые (получить выосоту для строки, отрисовать строку...). Это позволит потом дополнять систему египетскими иероглифами, например, без внесения существенных изменений.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 15, 2011, 17:49
Но писать транслитом?
А в чём собственно проблема? Не Вы ли предлагали Тойво писать тайский транслитом?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Тайльнемер on October 15, 2011, 17:57
Каждый шрифт—программный модуль (типа DLL/shared library)
Появятся шрифтовирусы…
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 15, 2011, 18:00
Вообще, я думаю, нужно делать не Юникод, а «язык универсальной разметки символов», который позволит в ASCII строках кодировать любые символы. В том числе и средствами стандартизированной транслитерации. Например, слово «символ» могло бы в нем кодироваться как «\cyr{simvol}».
Это не интересно. Такая разметка у каждого будет своя. Мне, например, было бы удобнее кодировать иероглифы кродами ЦанЦзе (например, \cj{hqi bbpe ino}), а кому-то будет удобнее что-то другое...
Так а **** *** вы **********???
Сделаймы стандарт, поддерживающий несколько различных более-менее стандартных способов, команд, транслитов. А в расширение вбубениваем либо как в тексе -- пользовательские подлючамые пакеты, либо настраиваемый компилятор, выдающий на ваш подогнанный под личные выпендрёжи код нормальный стандартный код.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 15, 2011, 18:03
Ах, да, мне видится такая система. Каждый шрифт—программный модуль (типа DLL/shared library).
И сделать шревты платформозависимыми? Нафиг, нафиг!!!
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 15, 2011, 18:09
(может быть отображено и кириллицей, и латиницей, в зависимости от предпочтений читателя)

Не дай бог! Что это за кодировка такая, если она не обеспечивает однозначного перевода своего кода в строку символов, а начинает изучать «предпочтения читателей»?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 15, 2011, 18:29
Короче оптимальный вариант -- сношать почту Юникода.
Они на потыкивания от частных лиц как, интересно,-- реагируют?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 15, 2011, 19:54
Ах, да, мне видится такая система. Каждый шрифт—программный модуль (типа DLL/shared library).
И сделать шревты платформозависимыми? Нафиг, нафиг!!!
+1.
Средства отображения символов должны быть портабельными. И еще было бьі неплохо дополнить их неким глобальным репозиторием, из которого автоматически подгружались бы отсутствующие в системе шрифты, таблицы транслитерации и т.п.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 15, 2011, 20:06
Каждой системе письменности полагается иметь свой код и правила интерпретации его параметров. Желательно, чтобы эти правила были максимально подобны друг другу.
можно использовать языковые коды тупо. А уж для конкретного языка всегда можно соорудить единые непротиворечивые правила.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 15, 2011, 21:31
(http://upload.wikimedia.org/wikipedia/commons/0/0e/Serbian_Cyrillic_Italic.svg)

lang:rus vs lang:srp
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Квас on October 15, 2011, 22:43
Но писать транслитом?
А в чём собственно проблема? Не Вы ли предлагали Тойво писать тайский транслитом?

Когда привыкаешь к графической системе так, что она «в крови», пользоваться транслитом — издевательство. Например, русский транслит не выношу. Несколько другой пример — математика в ТеХе: как известно, этот typesetting engine позволяет высококлассно набирать формулы, но в исходном коде они абсолютно нечитаемы (если речь о чём-то более сложном, чем a+b=c). Поэтому приходится либо смириться с тем, что работаешь вслепую, либо искать другие решения: например, редакторы, которые обеспечивают визуальный ввод формул.

С Тойво так: я не думаю, что тайскую письменность он собирается осваивать на уровне русской и даже вряд ли на уровне английской; набирать же наверняка приходится только пару слов раз в пятилетку. В такой ситуации транслит уместен. Кроме того, мой скрипт позволяет получать аутпут одновременно с печатанием.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Квас on October 15, 2011, 22:45
Язык важен для внешнего вида символов: ещё один пример — умлауты в немецком сидят сравнительно низко.

Есть ещё всякие типографские конвенции, которые неплохо бы учитывать: например, в режиме французского языка TeX автоматически использует French spacing.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 16, 2011, 06:20
Когда привыкаешь к графической системе так, что она «в крови», пользоваться транслитом — издевательство.

Лично я подразумевал, что обычная работа с текстом должна быть в WYSIWYG режиме, с привычными для вашей крови системами ввода.

Транслитный же код будет позволять редактировать текст в том числе и в случае технической недоступности специфических шрифтов, IME и интерпретаторов Лингвокода.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Квас on October 16, 2011, 14:37
Если дело касается русского или даже древнегреческого с политоникой, то проблем нет: WYSIWYG или нет, но благодаря юникоду есть возможность видеть текст как он есть.

А если юникод не помогает, как в случае с сабжем или церковнославянским? Для последнего HIP является опробованной и всех устраивающей кодировкой; можно представить, что HIP-текст красиво обрабатывается для вывода на печать (что действительно можно делать в ворде или ТеХе), но работать с исходниками типа
Гд\сь просвjьще'нiе мое` и= сп~си'тель мо'й
как-то не очень.

Для себя я различаю «вводимый текст», «хранимый текст» и «текст для печати». Что делать с «вводимым», если юникод не решение, а хочется видеть перед собой нечто похожее на текст? Наверно, костыли придумывать: например, вводить настоящую ять, которая преобразуется в HIP «jь».
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 10:40
(может быть отображено и кириллицей, и латиницей, в зависимости от предпочтений читателя)

Не дай бог! Что это за кодировка такая, если она не обеспечивает однозначного перевода своего кода в строку символов, а начинает изучать «предпочтения читателей»?
Никакая не обеспечивает. Что значит &laquo;однозначного&raquo;? Уникод вон, как Bhudh показал, неоднозначен. Более того, даже такая банальная вещь, как e с &laquo;огоньком&raquo; (как там его правильно положено называть?) по-разному должна выглядеть в польском и средневековой латыни (читал в описании какого-то шрифта, кажется, Junicode или Cardo, не помню). Какая попадется&mdash;зависит только от случая.

А мне кажется, что кодировка, которая позволяет представить себя в нужном виде&mdash;правильная кодировка.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 10:43
Ах, да, мне видится такая система. Каждый шрифт—программный модуль (типа DLL/shared library).
И сделать шревты платформозависимыми? Нафиг, нафиг!!!
Они и так платформеннозависимы.

Ну, можно хранить в байткоде, если Вам так нравятся кактусы. :donno:
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 17, 2011, 13:46
А мне кажется, что кодировка, которая позволяет представить себя в нужном виде&mdash;правильная кодировка.
Правильная кодировка — та, которая позволяет «писателю» быть уверенным в том, что «читатель» видит именно то, что он имел в виду.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 17, 2011, 14:06
Они и так платформеннозависимы.
times-new-roman.dll - это платформонезависимо? Как мне это использовать в linux\mac os x?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 17, 2011, 14:19
times-new-roman.dll
Штоэта⁈
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 17, 2011, 14:22
Штоэта⁈
Гипотетическая реализация шревтов в виде shared library.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 16:38
Они и так платформеннозависимы.
times-new-roman.dll - это платформонезависимо?
Во-первых, где я такое заявлял?

Во-вторых, растеризатор TT/PS—тоже платформа.

Как мне это использовать в linux\mac os x?
Запросто. Сам формат PE достаточно просто реализуется. Пробемы с запуском Windows-ных DLL в Linux и MacOS не из-за формата, а из-за API. Если в шрифте не будут вызываться функции библиотек Windows, а только функции шрифтового фреймворка, то переносимость отличаная. Проблемы будут только с неинтелловскими архитектурами, но уже даже маки перешли.

На худой конец, а кто говорил, что обязательно использовать PE? Можно распространять в виде исходных кодов и комплировать в PE/ELF/etc. при установке шрифта (вариант: для новых шрифтов при перестройке кеша fontconfig'а).
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 16:41
А мне кажется, что кодировка, которая позволяет представить себя в нужном виде&mdash;правильная кодировка.
Правильная кодировка — та, которая позволяет «писателю» быть уверенным в том, что «читатель» видит именно то, что он имел в виду.
А если писатель имеет в виду сербский текст, а то, кириллицей он или латиницей, ему безразлично?

Различие между кириллицей и латиницей по сути такое же, как и между курсивной и обычной буквой "а": обе несут один смысл. Кодировать надо смысл, а не внешнее представление.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 16:52
Србский език латинкој извињен мрти.
Или как то так.
В любом случае у нас будут свои собственные шрифты, с блэкджэком и лингвошлюхами. Потому как ныне существующие шрифты не позволяют красиво и адекватно набрать даже простенький немецкий текстик в традиционной типографике.
Короче уже опять Латекс получился. Ещё б не надо было этот зоопарк с кодировками разводить. Всё собираюсь Ксетекс разобрать, но и он вроде как болен.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 17:04
Србский език латинкој извињен мрти.
А сербы об этом в курсе?

В Потому как ныне существующие шрифты не позволяют красиво и адекватно набрать даже простенький немецкий текстик в традиционной типографике.
Linux Libertine (http://www.linuxlibertine.org/)? Вроде ж немец делал, там есть специятельные опции для немецких умляутов, специальная буква Т для немецкого и даже заглавный эсцет для написания заглавными буквами. Да, и капитель там тоже есть, правильная.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 17:30
А дефис немецкий там есть, а косые дроби, а курсивная дэ в разных вариантах?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Python on October 17, 2011, 17:33
А если писатель имеет в виду сербский текст, а то, кириллицей он или латиницей, ему безразлично?

Различие между кириллицей и латиницей по сути такое же, как и между курсивной и обычной буквой "а": обе несут один смысл. Кодировать надо смысл, а не внешнее представление.
Не всегда и не везде. Если взять, например, крымскотатарский, там кириллица и латиница представляют собой два правописания, каждое из которых страдает от невозможности передачи тех или иных звуков, отображаемых графически в другом.

Было бы неплохо различать транслитерацию для «абстрактной письменности», которая может определяться пользователем или параметрами текста, и транслитерацию для конкретных кириллицы или латиницы. Хотя, вообще, делать ставку на настройки пользователя — снизить перносимость файлов. Впрочем, желательно все же обеспечить совместимость между транслитом для различных графических систем одного языка, чтобы кириллица, латиница и т.д. отличались в исходниках лишь ключевым словом.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 17:55
А дефис немецкий там есть, а косые дроби, а курсивная дэ в разных вариантах?
:donno:
Проверьте, скажете.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 19:15
:donno:
Проверьте, скажете.
Ес чо их кокбэ нет в Юникоде.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 19:18
Проверьте, скажете.
Я чот не понЯл, як его в ЛаТекс установить этой шрихт —?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 17, 2011, 19:21
Можно попробовать сделать пробную версию Лингвокода в Лингвовики. По командам типа {{LC|cyr|p|r|i|m|e|r}} из нужных шрифтов будут доставаться нужные символы, а если их не хаватает, то и графические изображения.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 19:23
Проверьте, скажете.
Я вам сразу скажу: вот это их Ö никуда не годится.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 19:24
:donno:
Проверьте, скажете.
Ес чо их кокбэ нет в Юникоде.
Как бы есть OTF с разными символами в зависимости от языка и прайвит юз.

По-моему, для либертины перестали делать латеховую версию всвязи с отсутствием необходимости, и предлагают использовать ксетекс.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 19:25
Проверьте, скажете.
Я вам сразу скажу: вот это их Ö никуда не годится.
А у вас оно немецкое или французское? Там есть два штука. Немецкое на мой вкус странное (там точки слишком близко к букве), но делал немец, ему виднее. :donno:
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 19:27
Можно попробовать сделать пробную версию Лингвокода в Лингвовики. По командам типа {{LC|cyr|p|r|i|m|e|r}} из нужных шрифтов будут доставаться нужные символы, а если их не хаватает, то и графические изображения.
Я, кстати, втихаря паяю свою версию. Если будет не лень... Давайте их как-нибудь разграничим, а? У меня ЛингвоКод Добро, у Вас ЛингвоКод Хер У меня LingvoCode-D, у Вас LingvoCode-H?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 19:27
А их эти Ҳҳ, ҟ, Ҩҩ, ҵ и Ҿҿ делают меня хотеть крови.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 19:28
прайвит юз.
издеваетесь?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 19:29
(там точки слишком близко к букве), но делал немец, ему виднее.
То где точки раздристаны в стороны? Немец — не немец, а типограф он никакой.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 19:29
Зато Ять прекрасна, ять в восхищении!
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 17, 2011, 19:29
Я, кстати, тоже втихаря паяю свою версию.
Поподробнее, пліз.
Пайкой какого рода вы занимаетесь?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 19:31
А их эти Ҳҳ, ҟ, Ҩҩ, ҵ и Ҿҿ делают меня хотеть крови.
Видимо, делали люди, никогда их в глаза не видевшие. :donno: ОпенСорс прожект, можете нарисовать свои.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 19:44
Я, кстати, тоже втихаря паяю свою версию.
Поподробнее, пліз.
Пайкой какого рода вы занимаетесь?
Я начал писать мини-редактор типа &laquo;Блокнота&raquo;, для Windows, в котором внутренним представлением будет LingvoCode-D. Вывод будет (для начала) производиться банальным преобразованием в уникод и вызовом DrawTextW.

Делаю под Windows, ибо хочу в будущем определять тип кириллицы (RUS, BEL, UKR) в зависимости от системной раскладки, а в Линуксе ее определение&mdash;слишком сложная для меня задача.

Но для начала я хочу сделать универсальные {Cyrl}, {Latn}, а варианты для отдельных языков сделаю потом.

Синтаксис у меня&mdash;полнейший волюнтаризм и неучет общественного мнения будет примерно такой:
{Cyrl} Kyryllyca {Latn} Latin

Пока что сделал очень мало, сейчас нет времени особо (у компьютера я только вечером), но, думаю, до выходных доделаю.

Единственное, что меня волнует: такой код несовместим с ASCII. То есть ASCII "{}" = LC-D "{(}{)}". Это нехорошо, но выхода не вижу.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Oleg Grom on October 17, 2011, 19:44
Ну вот так всегда. Вроде бы годный шрифт, но с румыницей не дружит :( Хорошо хоть юсы с ятями в шрифтах нынче не редкость.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 19:44
Видимо, делали люди, никогда их в глаза не видевшие. :donno: ОпенСорс прожект, можете нарисовать свои.
Давненько мечтаю отрисовать собственный шрифт вообще-то говоря...
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Bhudh on October 17, 2011, 20:00
Видимо, делали люди, никогда их в глаза не видевшие.
Что очень странно.
При приёме в таблицу Уникода буквы предоставляют аутентичные нотариально заверенные сканы с факсимиле. Маст ред для шрифтмахеров тащьта.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 20:03
Видимо, делали люди, никогда их в глаза не видевшие.
Что очень странно.
При приёме в таблицу Уникода буквы предоставляют аутентичные нотариально заверенные сканы с факсимиле. Маст ред для шрифтмахеров тащьта.
Ну так в тех факсимилях другая гарнитура. Приспособили под свою, но утратили естественный вид. Что тут странного?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Hellerick on October 17, 2011, 20:06
Единственное, что меня волнует: такой код несовместим с ASCII. То есть ASCII "{}" = LC-D "{(}{)}". Это нехорошо, но выхода не вижу.

А так, чтобы он реагировал имключительно на фигурные скобки, содержащие строго заданный набор ключевых слов, сделать нельзя? Тогда случаи несовместимости будут сведены к минимуму.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 20:08
Ну так в тех факсимилях другая гарнитура. Приспособили под свою, но утратили естественный вид. Что тут странного?
Учитывая, что сама по себе отрисовка шрифта — дело очень трудоёмкое, весьма странно наблюдать такую халатность и нежелание потратить полтора процента времени на ознакомление с естественным видом отрисовываемых ълифов.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Demetrius on October 17, 2011, 20:12
Единственное, что меня волнует: такой код несовместим с ASCII. То есть ASCII "{}" = LC-D "{(}{)}". Это нехорошо, но выхода не вижу.

А так, чтобы он реагировал имключительно на фигурные скобки, содержащие строго заданный набор ключевых слов, сделать нельзя? Тогда случаи несовместимости будут сведены к минимуму.
Можно, но не нужно. Потому что тогда появится еще и никак не детектируемая несовместимость версий. А так хотя бы можно покрасить неизвестную кодировку красным и вывести транслит.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Квас on October 17, 2011, 20:48
К вопросу об умлаутах: в немецком языке они сидят низко, так и задумано.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Квас on October 17, 2011, 20:53
Я начал писать мини-редактор типа «Блокнота», для Windows, в котором внутренним представлением будет LingvoCode-D. Вывод будет (для начала) производиться банальным преобразованием в уникод и вызовом DrawTextW.

Мне кажется, эту вещь можно будет хорошо использовать для LuaTeXа, когда он будет пригоден к употреблению. Можно и для всякого другого TeXа, но тогда предварительную обработку файлов придётся производить отдельно.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 20:54
К вопросу об умлаутах: в немецком языке они сидят низко, так и задумано.
Про шрифтоустановку не подскажете?
Пошукаю за умляуты. Шведы точно не заморачиваются и ставят вгору стандартный диерезис, хотя видимо и не столь сильны традициями, но пережили они золотой век дизайна и это не могло не сказаться на шривтах в том числе.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Квас on October 17, 2011, 20:55
К вопросу об умлаутах: в немецком языке они сидят низко, так и задумано.
Про шрифтоустановку не подскажете?

Чево?
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 20:56
Чево?
В "Компутары->Вокруг ТеХа"
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Квас on October 17, 2011, 20:58
Чево?
В "Компутары->Вокруг ТеХа"

Так уже.
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Искандер on October 17, 2011, 20:59
ааа, это я торможу.
спать пора...
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Квас on October 17, 2011, 21:14
Спокойной ночи. :)
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: DarkMax2 on July 27, 2017, 10:44
Привѣ ѫн заре кум пе мърй
Ръсаре ши стрълуче,
Пе мишкътоареле кърърй
Коръбий негре дуче.

Ѫл веде азй, ѫл веде мѫни,
Астфел доринца-й гата;
Ел йар, привинд де съптъмѫнй,
Ѫй каде драгъ фата.

Кум ѣ пе коате-шй ръзима
Висѫнд але ей тѫмпле,
Де дорул луй ши инимa
Ши суфлету-й се ѫпле.
Privea în zare cum pe mări
Răsare şi străluce,
Pe mişcătoarele cărări
Corăbii negre duce.

Îl vede azi, îl vede mâni,
Astfel dorinţa-i gata;
El iar, privind de săptămâni,
Îi cade dragă fata.

Cum ea pe coate-şi răzima
Visând ale ei tâmple,
De dorul lui şi inima
Şi sufletu-i se împle.

Гарно :)
Title: [ПлачЪ] румынская кириллица и юникод.
Post by: Ion Borș on July 27, 2017, 13:39
Гарно :)
:yes:
Привя ѫн заре кум пе мэрь
Рэсаре ши стрэлуче,
Пе мишкэтоареле кэрэрь
Корэбий негре дуче.

Ыл веде азь, ыл веде мыне,
Астфел доринца-й гата;
Ел яр, привинд де сэптэмынь,
Ый каде драгэ фата.

Кум я пе коате-шь резема
Висынд але ей тымпле,
Де дорул луй ши инимa
Ши суфлету-й се ымпле.
Privea în zare cum pe mări
Răsare şi străluce,
Pe mişcătoarele cărări
Corăbii negre duce.

Îl vede azi, îl vede mâne,
Astfel dorinţa-i gata;
El iar, privind de săptămâni,
Îi cade dragă fata.

Cum ea pe coate-şi rezema
Visând ale ei tâmple,
De dorul lui şi inima
Şi sufletu-i se împle.

Title: [ПлачЪ] румынская кириллица и юникод.
Post by: DarkMax2 on July 27, 2017, 16:02
Мені чомусь я не подобається в неслов'янських мовах.