Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Ответ

Следующие ошибки возникли при попытке отправки сообщения:
Внимание! Пока вы просматривали тему, появилось несколько новых ответов (3). Возможно, вы захотите изменить свое сообщение.
Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.
Ограничения: максимум вложений в сообщении — 3 (3 осталось), максимальный размер всех файлов — 300 КБ, максимальный размер одного файла — 100 КБ
Снимите пометку с вложений, которые необходимо удалить
Перетащите файлы сюда или используйте кнопку для добавления файлов
Вложения и другие параметры
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр

Сообщения в этой теме

Автор Red Khan
 - февраля 9, 2021, 14:32
Надо бы issue открыть, а то именно у нас это не то чтобы feature breaking, но таки актуально.
Автор Bhudh
 - февраля 9, 2021, 14:06
Не знаю. Юникодные функции в PHP отдельным множеством сделаны, видимо, принимает текст из textarea в ответе какая-то из неюникодных и её трэба заменити.
Надо тестировать, в каком именно месте происходит былинный отказ.
Автор Red Khan
 - февраля 9, 2021, 13:55
Цитата: Bhudh от октября 12, 2020, 18:25
Это из-за того, что PHP не воспринимает строки, состоящие только из суррогатных пар.
В седьмой версии так же? Это вообще как-то поправить можно?
Автор Red Khan
 - октября 12, 2020, 23:04
Цитата: Валентин Н от октября 12, 2020, 19:41
Эмодзи тоже не видит.
Эмодзи в той же первой плоскости.
Автор Red Khan
 - октября 12, 2020, 22:58
Вроде разобрался, спасибо.
Цитировать
Surrogates
The UCS uses surrogates to address characters outside the initial Basic Multilingual Plane without resorting to more-than-16-bit byte representations. There are 1024 "high" surrogates (D800–DBFF) and 1024 "low" surrogates (DC00–DFFF). By combining a pair of surrogates, the remaining characters in all the other planes can be addressed (1024 × 1024 = 1048576 code points in the other 16 planes).
(wiki/en) Universal_Character_Set_characters#Surrogates

То есть в юникоде есть полоскости и вся клинопись, тюркские руны, египетские иероглифы и прочяя находятся не в "основной многоязычной плоскости" (плоскости 0) вместе со всякими латиницами-кириллицами-арабицами-иероглифами, а в "дополнительной многоязычной плоскости" (плоскости 1). А вот эти суррогатные пары по сути являются "ссылкам" или "ярлыками" на другие плоскости. Уровни сумрака, блин. :)
(wiki/ru) Плоскость_(Юникод)
Автор Bhudh
 - октября 12, 2020, 22:26
ЦитироватьCode points from U+010000 to U+10FFFF​
Code points from the other planes (called Supplementary Planes) are encoded as two 16-bit code units called a surrogate pair, by the following scheme:
  • 0x10000 is subtracted from the code point (U), leaving a 20-bit number (U') in the hex number range 0x00000–0xFFFFF. Note for these purposes, U is defined to be no greater than 0x10FFFF.
  • The high ten bits (in the range 0x000–0x3FF) are added to 0xD800 to give the first 16-bit code unit or high surrogate (W1), which will be in the range 0xD800–0xDBFF.
  • The low ten bits (also in the range 0x000–0x3FF) are added to 0xDC00 to give the second 16-bit code unit or low surrogate (W2), which will be in the range 0xDC00–0xDFFF.
Автор Red Khan
 - октября 12, 2020, 22:10
Цитата: Bhudh от октября 12, 2020, 21:58
Цитата: Red Khan от октября 12, 2020, 19:39А зачем тогда они нужны?
Из них составляются все коды высших диапазонов в UTF-16. Low_surrogate_code + high_surrogate_code.
Если глянуть на эту схему и её описание то не все, только D8–DF
(wiki/en) File:Unifont_Full_Map.png

Или которые с F9 тоже суррогатные пары?
Автор Bhudh
 - октября 12, 2020, 21:58
Цитата: Red Khan от октября 12, 2020, 19:39А зачем тогда они нужны?
Из них составляются все коды высших диапазонов в UTF-16. Low_surrogate_code + high_surrogate_code.
Автор Валентин Н
 - октября 12, 2020, 19:41
Эмодзи тоже не видит.
Автор Red Khan
 - октября 12, 2020, 19:39
Цитата: Bhudh от октября 12, 2020, 19:15
Ну как заполнили. Суррогатные пары в диапазоне U+D800 — U+DFFF размещены.
А зачем тогда они нужны?