Лингвофорум

Лингвоблоги => Личные блоги => Блоги => Fobee => Тема начата: Fobee от декабря 15, 2011, 04:07

Название: Небольшое усложнение сортировки.
Отправлено: Fobee от декабря 15, 2011, 04:07
Вот такая задача, как сортировка массива, думаю, известна всем, равно как и алгоритм. Интересно, сколько народу совершило бы ошибки, если бы их попросили упорядочить строковые данные в файле по алфавиту с различением букв Е и Ё.
Название: Небольшое усложнение сортировки.
Отправлено: arseniiv от декабря 15, 2011, 05:28
Юникод ещё хлеще велит.
Название: Небольшое усложнение сортировки.
Отправлено: O от декабря 15, 2011, 06:00
Юникод велит диакритику считать по определённым правилам, а топикпастер, имхо, имел в виду, что в самом тексте либо вообще не обозначены буквы ё, либо это сделано непоследовательно. А такая задача не решается без семантического анализа. Простейший пример: слова все/всё в неполном предложении. Если же нет контекста, то задача вовсе не решаема.
Название: Небольшое усложнение сортировки.
Отправлено: arseniiv от декабря 15, 2011, 07:47
А я тоже не про диакритику, а про разные упорядочения символов в зависимости от локали. Ср. турецкий с нехорошо спаренными i.
Название: Небольшое усложнение сортировки.
Отправлено: Bhudh от декабря 15, 2011, 13:27
Почему нехорошо? Как везде: сначала идут буквы без точек, по тем с точками...
Название: Небольшое усложнение сортировки.
Отправлено: arseniiv от декабря 15, 2011, 14:38
Цитата: Bhudh от декабря 15, 2011, 13:27
Почему нехорошо?
Потому что коды нехорошо подобрали.
Название: Небольшое усложнение сортировки.
Отправлено: Bhudh от декабря 16, 2011, 01:10
А тебе надо прям чтоб коды через ±32?
Э нет, в латинице эта лафа после торна заканчивается!