Лингвофорум

Общий раздел => Наука и техника => Компьютеры => Тема начата: cetsalcoatle от августа 13, 2015, 21:40

Название: Что за глюк?
Отправлено: cetsalcoatle от августа 13, 2015, 21:40
Вчера ноутбук внезапно выдал "Свободного места на диске С нет". Я думаю: "Что могло там такого установиться? В системный диск, куда я вообще ничего не устанавливаю, в принципе. :o Сегодня смотрю свойства: "43,1 гб из 111 свободно."
Вот как такое возможно? :wall:
Название: Что за глюк?
Отправлено: Ильич от сентября 24, 2015, 13:32
Решил не создавать новую тему, потому что тоже что-то совсем непонятное.

(http://mtdata.ru/u25/photo0170/20798391701-0/original.jpg)
Название: Что за глюк?
Отправлено: Demetrius от сентября 24, 2015, 13:38
А что непонятного? Чем меньше строка, тем сложнее алгоритмам угадать кодировку.
Название: Что за глюк?
Отправлено: Ыняша от сентября 24, 2015, 14:35
Цитата: Ильич от сентября 24, 2015, 13:32
(http://mtdata.ru/u25/photo0170/20798391701-0/original.jpg)
Ничего не произошло. Погодите, кто-то в дверь стучит
Название: Что за глюк?
Отправлено: Demetrius от сентября 24, 2015, 14:41
Цитата: Ыняша от сентября 24, 2015, 14:35
Ничего не произошло.
Это в 2000 (и, наверное, в XP) работало. В новых версиях чуть поменяли алгоритм угадывания кодировки.
Название: Что за глюк?
Отправлено: Upliner от сентября 24, 2015, 14:43
Цитата: cetsalcoatle от августа 13, 2015, 21:40
Вчера ноутбук внезапно выдал "Свободного места на диске С нет". Я думаю: "Что могло там такого установиться? В системный диск, куда я вообще ничего не устанавливаю, в принципе. :o Сегодня смотрю свойства: "43,1 гб из 111 свободно."
Вот как такое возможно? :wall:
Возможно, была ошибка в файловой системе, а при следующей загрузке chkdsk пофиксил.
Название: Что за глюк?
Отправлено: Ыняша от сентября 24, 2015, 14:46
Цитата: Demetrius от сентября 24, 2015, 14:41
Это в 2000 (и, наверное, в XP) работало. В новых версиях чуть поменяли алгоритм угадывания кодировки.
Зачем угадывать кодировку для латинских букв? o.o
Они вроде во всех кодировках по стандарту идут до 128 позиции. А с 128 по 256 идут локальные.
Название: Что за глюк?
Отправлено: Demetrius от сентября 24, 2015, 14:49
Цитата: Ыняша от сентября 24, 2015, 14:46
Зачем угадывать кодировку для латинских букв? o.o
Они вроде во всех кодировках по стандарту идут до 128 позиции.
Числа для латинцы то одинаковые¹, а вот записываться на диске эти числа могут по-разному (в примере с Бушем «Блокнот» записывал по умолчанию в однобайтовой кодировке, а угадывал как двухбайтовую).

Цитата: Ыняша от сентября 24, 2015, 14:46
А с 128 по 256 идут локальные.
Не обязательно «по 256».



¹ В кодировках, которые предлагаются «Блокнотом».
Название: Что за глюк?
Отправлено: Ильич от сентября 24, 2015, 14:54
Цитата: Demetrius от сентября 24, 2015, 14:41
Цитата: Ыняша от сентября 24, 2015, 14:35
Ничего не произошло.
Это в 2000 (и, наверное, в XP) работало. В новых версиях чуть поменяли алгоритм угадывания кодировки.
У меня XP. И выглядит вот так
Название: Что за глюк?
Отправлено: Demetrius от сентября 24, 2015, 14:56
Срочно настраивать подмену шрифта для иероглифов! :negozhe:
Название: Что за глюк?
Отправлено: Ыняша от сентября 24, 2015, 14:56
Цитата: Demetrius от сентября 24, 2015, 14:49
Числа для латинцы то одинаковые¹, а вот записываться на диске эти числа могут по-разному (в примере с Бушем «Блокнот» записывал по умолчанию в однобайтовой кодировке, а угадывал как двухбайтовую).



¹ В кодировках, которые предлагаются «Блокнотом».
Я что-то смутно припоминаю, что у майкрософта был свой особый юникод.
В utf-8 же байт со значением меньше 128 автоматически распознаётся как ascii, потому что utf-8 смешанный 1-2 байтовый.

Ну ещё с byte order может быть заковыка, но это уже из другой оперы

Тогда простительно.
Название: Что за глюк?
Отправлено: Demetrius от сентября 24, 2015, 14:57
Цитата: Ыняша от сентября 24, 2015, 14:56
Я что-то смутно припоминаю, что у майкрософта был свой особый юникод.
Не свой особый, а именно такой, каким его первоначально представляли.
Название: Что за глюк?
Отправлено: Тайльнемер от сентября 24, 2015, 17:59
Цитата: Ыняша от сентября 24, 2015, 14:56
В utf-8 же байт со значением меньше 128 автоматически распознаётся как ascii, потому что utf-8 смешанный 1-2 байтовый.
Блокнот-то думает, что это UTF-16.
Название: Что за глюк?
Отправлено: Python от сентября 24, 2015, 23:51
(wiki/en) Bush_hid_the_facts (http://en.wikipedia.org/wiki/Bush_hid_the_facts)
Название: Что за глюк?
Отправлено: Ильич от сентября 25, 2015, 00:08
Цитата: Python от сентября 24, 2015, 23:51
(wiki/en) Bush_hid_the_facts (http://en.wikipedia.org/wiki/Bush_hid_the_facts)

10 лет не замечали, с ума сойти!
ЦитироватьThe bug appeared for the first time in Windows NT 3.5, released 1994, but was not discovered until early 2004.
Название: Что за глюк?
Отправлено: Demetrius от сентября 25, 2015, 00:12
Это не совсем баг. Угадывание кодировки на то и угадывание, что оно не может быть 100% точным. Они только слегка подправили алгоритм, но и сейчас он наверняка иногда определяет кодировку неправильно (особенно на таких коротких предложениях без контекста). И он в принципе не может быть 100% правильным.
Название: Что за глюк?
Отправлено: sasza от сентября 25, 2015, 04:45
Цитата: Ильич от сентября 25, 2015, 00:08
10 лет не замечали, с ума сойти!
Наверняка кто-то на него натыкался и раньше, просто далеко не каждый, кто замечает какой-нибудь глюк, обращается в поддержку, или ещё куда-то.
Название: Что за глюк?
Отправлено: Upliner от сентября 25, 2015, 10:18
И как пишеь Вики в самых распространённых тогда виндах в нотпаде просто не было юникода, неудивительно, что никто не замечал