Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Предложения новых фичуров, изменений и т.п.

Автор RawonaM, марта 2, 2010, 12:40

0 Пользователи и 2 гостей просматривают эту тему.

Guldrelokk

В общем, с одной стороны, шрифт выбирается системой с учётом поддерживаемых им языков (и настроек), с другой — OpenType позволяет привязывать разные варианты начертания к отображаемому языку. Так получается всё то, о чём я писал выше, и многое другое.
Вот только язык надо указать.

Guldrelokk

Наглядный пример. Там 這 и 这, 誤 и 误 и так далее обозначены разными символами Юникода, хотя на самом деле это одни и те же знаки. Когда [lang] работал, достаточно было указать его и использовать общие символы, чтобы всё отображалось как надо. Такие можно копировать куда угодно и они везде будут смотреться органично. Работает это на любой современной системе «из коробки».

Bhudh

Цитата: Guldrelokk от февраля  8, 2018, 09:35
Там 這 и 这, 誤 и 误 и так далее обозначены разными символами Юникода, хотя на самом деле это одни и те же знаки.
Гхм. А что означает "одни и те же знаки" и почему у одних и тех же знаков разные коды Уникода? Что, собственно, и отличает разные знаки Уникода друг от друга.
OpenType, вернее, полностью поддерживающий его особенности софт, поддерживает выбор определённых глифов для определённых типов письменностей, кодируемых в HTML и CSS с помощью lang.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Guldrelokk

Цитата: Bhudh от февраля  8, 2018, 17:01
Гхм. А что означает "одни и те же знаки" и почему у одних и тех же знаков разные коды Уникода?
Это одни и те же графемы китайского письма, Юникод тут при чём? Там много такого накодировано, теперь разгребают.
Цитата: Bhudh от февраля  8, 2018, 17:01
OpenType, вернее, полностью поддерживающий его особенности софт, поддерживает выбор определённых глифов для определённых типов письменностей, кодируемых в HTML и CSS с помощью lang.
Для языков.
ЦитироватьLocalized forms are associated with specific languages and are activated by language tags. Which glyph is used as the localized form should be determined by the language the user has specified.
Конечно, вы можете считать, что вуковица и русский алфавит (и вообще любые два набора символов для разных языков, даже одинаковые) — разные типы письменности; это ничего не меняет.

Bhudh

Цитата: Recommended implementation: For a given Unicode value, the font contains glyphs for two or more locales.
У приведённых Вами иероглифов разные Unicode values, в отличие от вуковской и русской б.
То есть это разные виды подстановки глифов: один использует ссылку на внутришрифтовой глиф (localized variant form) для одного value, другой ссылку на другой Unicode value.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Guldrelokk

Цитата: Bhudh от февраля  8, 2018, 18:41
У приведённых Вами иероглифов разные Unicode values, в отличие от вуковской и русской б.
Конечно. Я знаю. Вы о чём?
Я о том, что 這 и 这, которые автозаменять надо для перевода из традиционных в упрощённые, были бы не нужны, если бы можно было указать язык.
Demetrius как раз показывал, как это работает.

Bhudh

У меня, видимо, другое понимание определения «один и тот же».
Для меня пара «традиционный – упрощённый» — именно пара. Два разных иероглифа. Используемых в разных контекстах и разных языках. Этого для меня достаточно, чтобы не считать их одним и тем же иероглифом.
А что там вместо чего подставляется, это уже филологические заморочки.
Можно знак ханча вместо знака хангыля подставить и на этом основании объявить их "одним и тем же" знаком.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Guldrelokk

Цитата: Bhudh от февраля  8, 2018, 20:19
Для меня пара «традиционный – упрощённый» — именно пара. Два разных иероглифа. Используемых в разных контекстах и разных языках.
Байхуа — это один язык. Любая цитата на нём облачается в различные иероглифы в зависимости от страны пишущего. Далее, «традиционные иероглифы» сами бывают разные и происходит с ними то же самое.
Я уж не говорю о том, что 這 и 这 никуда не денутся.
Цитата: Bhudh от февраля  8, 2018, 20:19
А что там вместо чего подставляется, это уже филологические заморочки.
Это вполне технические заморочки. Китайской Википедии приходится использовать специальный конвертер.
Цитата: Bhudh от февраля  8, 2018, 20:19
Можно знак ханча вместо знака хангыля подставить и на этом основании объявить их "одним и тем же" знаком.
Ерунда, там нет двустороннего однозначного соответствия и это разные системы письма.

Bhudh

Цитата: Guldrelokk от февраля  8, 2018, 20:49
Байхуа — это один язык.
Не уподобляйтесь долбославам, которые орут, что "деванагари это язык". Байхуа это система письменности.

Цитата: Guldrelokk от февраля  8, 2018, 20:49
Это вполне технические заморочки.
Они от этого не перестают быть филологическими. Какая разница, от чего техникам плохо.

Цитата: Guldrelokk от февраля  8, 2018, 20:49
там нет двустороннего однозначного соответствия
Хотите сказать, в байхуа есть?

Цитата: Замена иероглифа на другой с тем же или похожим произношением:
    餘 → 余; 穀 → 谷; 後 → 后 и т. д.
Объединение нескольких иероглифов в один с более простым написанием:
    髮 и 發 → 发; 儘 и 盡 → 尽 и т. д.
Поскольку несколько традиционных иероглифов иногда заменяются на один и тот же упрощённый, издание классических текстов упрощённым письмом может вызвать путаницу.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Guldrelokk

Цитата: Bhudh от февраля  8, 2018, 21:58
Не уподобляйтесь долбославам, которые орут, что "деванагари это язык". Байхуа это система письменности.
?!
https://books.google.ru/books?id=n4ViAAAAMAAJ&q=байхуа
https://books.google.ru/books?id=9TsuAQAAIAAJ&q=байхуа
https://books.google.ru/books?id=UKI5AAAAMAAJ&q=байхуа
https://books.google.ru/books?id=V0YHAQAAIAAJ&q=байхуа
Цитата: Bhudh от февраля  8, 2018, 21:58
Они от этого не перестают быть филологическими. Какая разница, от чего техникам плохо.
Чтобы «техникам» не было так плохо и затеяли унификацию ханьцзы.
Цитата: Bhudh от февраля  8, 2018, 21:58
Хотите сказать, в байхуа есть?
Почти.

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Guldrelokk

Цитата: Bhudh от февраля  8, 2018, 22:18
То есть байхуа и байхуавэнь это разные вещи?
(wiki/en) Written vernacular Chinese
Нет, и то, и другое обозначает современный письменный литературный китайский, см. книги выше. Его устная форма — путунхуа.
(wiki/ru) Путунхуа
Цитата: Википедия от Путунхуá (кит. трад. 普通話, упр. 普通话, пиньинь: Pǔtōnghuà) — официальный язык в Китайской Народной Республике, на Тайване и в Сингапуре. Данное понятие относится прежде всего к устной, произносительной норме. Письменный стандарт называется байхуа.

Фонетика и лексика путунхуа основана на произносительной норме пекинского диалекта, принадлежащего северной группе диалектов китайского языка. Грамматика путунхуа соответствует нормам, закреплённым в литературных произведениях на современном китайском языке (байхуа), которые также наиболее близки к северным диалектам.
Кантонский, записанный ханьцзы, никогда не назовут байхуа.

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Guldrelokk

Ну никто не исключает из Юникода варианты иероглифов, как не исключает ſ, например — иногда это бывает нужно. Но в большинстве случаев больше подходят объединённые символы. Во многих шрифтах вообще нет этих отдельно закодированных вариантов, например, 直 у меня квадратик, при том что 直 отображается так, как должен 直, если указать lang="ja". Фактически объединённые иероглифы из Юникода используются очень широко, и чтобы они правильно отображались, надо указывать язык.

АБР-2

Думаю, что лучше будет сделать на этом сайте базовый шрифт cambria math, который всех устроит, и сделать кнопку диакритику, чтобы к любой букве можно было приставить любой символ.
Хариманский язык.  Никогда не поверю в эсперантское "лис-о", "утк-о". Ненормально это. Отверг Израиль доброе; враг будет преследовать его (Ос.8:3). Читайте Жемчужную Библию. http://www.proza.ru/avtor/brayev Проповедание неверящим важнее храмового богослужения . Изучая англоязык, не выверни себе челюсть: сэфайа - сапфир (!!!) Арахау - это путь к себе. Капитализм - это частный капитал плюс латинизация всей страны. РПЦ - столп и утверждение Истины. Честь - это всего лишь следование за своим рассудком. Псевда и фрипулья убивают душу лингвоюзера. Глобусы Мокшании самые крупные в мире! Упадочная Русь не избежит большой войны. ЦС язык не нужен. Кофеюзеры по найтам постят форума́. Кто копает на одном месте, у того глубже результат. Главная проблема при создании языков - трудность запоминания слов (для людей с обычной памятью). Christoros madûmbra!

Guldrelokk

Цитата: АБР-2 от февраля  8, 2018, 23:56
Думаю, что лучше будет сделать на этом сайте базовый шрифт cambria math, который всех устроит, и сделать кнопку диакритику, чтобы к любой букве можно было приставить любой символ.
Дело не в шрифте, то есть не только в нём. Вот я сейчас скопирую два первых попавшихся предложения с японского сайта и с тайваньского:
帰する理由は大きく3つに絞られる。
提供亞太電信各縣市之營或加盟門市據點.
Выделенные красным символы выглядят одинаково. Но вообще-то они не должны выглядеть одинаково. И они действительно могут не выглядеть одинаково, даже если шрифт один и тот же. Нужно только указать с помощью атрибута lang, где китайский, а где японский, и выбираться будут правильные варианты.
Далее, никакой шрифт не включает всего. Если ЛФ будет подгружать шрифты для всех языков, каждая страница будет открываться полчаса. Всё равно для большинства письменностей будет использоваться шрифт, который у вас установлен (если вообще установлен хоть один). Современная система может делать этот выбор с учётом языка, который устанавливает атрибут lang. Это второй способ решения проблемы выше. Больше того, это позволяет избавиться от неестественных вещей типа урду насхом и в целом настроить шрифты для отдельного языка очень полезно.
Ещё атрибут lang активно используют поисковики, а также скринридеры для людей со слабым зрением.

Bhudh

Цитата: Guldrelokk от февраля  9, 2018, 00:26
И они действительно могут не выглядеть одинаково, даже если шрифт один и тот же.
При условии, разумеется, наличия otf-шрифта и поддерживающего софта.

Цитата: Guldrelokk от февраля  8, 2018, 23:48
например, 直 у меня квадратик, при том что 直 отображается так, как должен 直, если указать lang="ja".
Значит, дополнительный глиф для уникодного 直 выглядит так же, как основной глиф уникодного (который в шрифте отсутствует)
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Guldrelokk

Цитата: Bhudh от февраля  9, 2018, 02:27
При условии, разумеется, наличия otf-шрифта и поддерживающего софта.
Конечно.
Цитата: Bhudh от февраля  9, 2018, 02:27
Значит, дополнительный глиф для уникодного 直 выглядит так же, как основной глиф уникодного (который в шрифте отсутствует)
А я о чём?

АБР-2

Цитата: Guldrelokk от февраля  9, 2018, 00:26
Цитата: АБР-2 от февраля  8, 2018, 23:56
Думаю, что лучше будет сделать на этом сайте базовый шрифт cambria math, который всех устроит, и сделать кнопку диакритику, чтобы к любой букве можно было приставить любой символ.
Дело не в шрифте, то есть не только в нём. Вот я сейчас скопирую два первых попавшихся предложения с японского сайта и с тайваньского:
帰する理由は大きく3つに絞られる。
提供亞太電信各縣市之營或加盟門市據點.
Выделенные красным символы выглядят одинаково. Но вообще-то они не должны выглядеть одинаково. И они действительно могут не выглядеть одинаково, даже если шрифт один и тот же. Нужно только указать с помощью атрибута lang, где китайский, а где японский, и выбираться будут правильные варианты.
Далее, никакой шрифт не включает всего. Если ЛФ будет подгружать шрифты для всех языков, каждая страница будет открываться полчаса. Всё равно для большинства письменностей будет использоваться шрифт, который у вас установлен (если вообще установлен хоть один). Современная система может делать этот выбор с учётом языка, который устанавливает атрибут lang. Это второй способ решения проблемы выше. Больше того, это позволяет избавиться от неестественных вещей типа урду насхом и в целом настроить шрифты для отдельного языка очень полезно.
Ещё атрибут lang активно используют поисковики, а также скринридеры для людей со слабым зрением.


Ничего не понял. Сейчас загружено 11 шрифтов, базовый вердана. Я бы предложил их все заменить на Камбрия
Хариманский язык.  Никогда не поверю в эсперантское "лис-о", "утк-о". Ненормально это. Отверг Израиль доброе; враг будет преследовать его (Ос.8:3). Читайте Жемчужную Библию. http://www.proza.ru/avtor/brayev Проповедание неверящим важнее храмового богослужения . Изучая англоязык, не выверни себе челюсть: сэфайа - сапфир (!!!) Арахау - это путь к себе. Капитализм - это частный капитал плюс латинизация всей страны. РПЦ - столп и утверждение Истины. Честь - это всего лишь следование за своим рассудком. Псевда и фрипулья убивают душу лингвоюзера. Глобусы Мокшании самые крупные в мире! Упадочная Русь не избежит большой войны. ЦС язык не нужен. Кофеюзеры по найтам постят форума́. Кто копает на одном месте, у того глубже результат. Главная проблема при создании языков - трудность запоминания слов (для людей с обычной памятью). Christoros madûmbra!

АБР-2

Один шрифт не может перегрузить компьютер более, чем 11 шрифтов. Камбриа мат имеет ряд преимуществ. К примеру, буквы ïî не наползают друг на друга, строки не слипаются, и т.д. диакритика на этом сайте всё равно поддерживается, я предложил только сделать это удобнее.
Хариманский язык.  Никогда не поверю в эсперантское "лис-о", "утк-о". Ненормально это. Отверг Израиль доброе; враг будет преследовать его (Ос.8:3). Читайте Жемчужную Библию. http://www.proza.ru/avtor/brayev Проповедание неверящим важнее храмового богослужения . Изучая англоязык, не выверни себе челюсть: сэфайа - сапфир (!!!) Арахау - это путь к себе. Капитализм - это частный капитал плюс латинизация всей страны. РПЦ - столп и утверждение Истины. Честь - это всего лишь следование за своим рассудком. Псевда и фрипулья убивают душу лингвоюзера. Глобусы Мокшании самые крупные в мире! Упадочная Русь не избежит большой войны. ЦС язык не нужен. Кофеюзеры по найтам постят форума́. Кто копает на одном месте, у того глубже результат. Главная проблема при создании языков - трудность запоминания слов (для людей с обычной памятью). Christoros madûmbra!

Bhudh

Цитата: АБР-2 от февраля  9, 2018, 10:16
Один шрифт не может перегрузить компьютер более, чем 11 шрифтов.
Гыгы. Универсалия весом в десятки мегабайт ещё как может перебить десяток мелких шрифтов в пару мегабайт сообща.
А Cambria Math, насколько я помню, не один шрифт, а семейство. И распространяется в спецформате типа файлового архива, не помню сейчас расширения, а гуглить некогда.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Валентин Н

Можно бы решить проще, дать возможность в теге фонт указывать ссылку на шрифт. И пусть каждый сам думает какие символы и откуда пихать. И не говорите про вирусы, картинки же пихаем.
ЗАБАНИЛ ВИКИПЕДИЮ
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı
Препинания авторские!

Bhudh

Про Универсалию тут уже сто раз говорили. Никто её тянуть не будет.
Тут либо ограничивать размер шрифта, на который ссылаемся, либо просто закидывать его в аттач и брать оттуда.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Валентин Н

Цитата: Bhudh от февраля 10, 2018, 12:44
Про Универсалию тут уже сто раз говорили. Никто её тянуть не будет.
А зачем её тянуть? Достаточно вытянуть только задействованные символы.
ЗАБАНИЛ ВИКИПЕДИЮ
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı
Препинания авторские!

Bhudh

Ахренеть. А Вам известен формат шрифта, из которого можно вытянуть отдельный диапазон глифов?! :o
По-моему, легче иметь отдельный тэг и базу символов на сервере, чтобы по ID можно было символ картинкой вставлять. Примерно как сделано на Википедии с <hiero>.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр