Цитата: Rwseg от февраля 2, 2016, 01:16Судя по всему, русизмов в тексте совсем немного. Проблемы появляются, когда с этими буквами начинают писаться неадаптированные заимствования, которые вытесняют и адаптированные.
Раз тут вспоминался якутский, то решил проверить. Кроме Нового Завета текстов я особо не нашёл, но и он вполне показателен (ведь по идее там точно должны быть заимствования из русского).
Так вот из почти 895 тыс. букв те, которых меньше 1% и которые вроде лишние для якутского
Ч 4325 0.51%
Е 3289 0.39%
В 1440 0.17%
Я 683 0.08%
Ф 647 0.08%
З 271 0.03%
Ц 205 0.02%
Ж 12 0.00%
Ю 7 0.00%
Ш 7 0.00%
В сумме чуть более 1%. Возникает вопрос: чем мешает и какие создаёт проблемы этот 1% букв, и что кардинально изменится, если убрать этот 1% букв.
Цитата: Rwseg от февраля 2, 2016, 23:03Понятно. Просто там нет версии онлайн и поэтому в выпадающем списке якутского не было.Цитата: Red Khan от февраля 2, 2016, 22:50http://ibt.org.ru/ru/mediaЦитата: Rwseg от февраля 2, 2016, 20:29А где там якутский? Я его там в упор не вижу.
Ссылка та самая, //ibt.org.ru.
Внизу, буква Я.
Цитата: Red Khan от февраля 2, 2016, 22:50http://ibt.org.ru/ru/mediaЦитата: Rwseg от февраля 2, 2016, 20:29А где там якутский? Я его там в упор не вижу.
Ссылка та самая, //ibt.org.ru.
Цитата: Red Khan от января 30, 2016, 16:11Ну тогда, владею в совершенствеЦитата: TawLan от января 29, 2016, 14:43Если понимаешь что-то, кроме числительных, то больше.
Не знаю, потому что не знаю насколько понимает татарин.
Цитата: Rwseg от февраля 2, 2016, 20:29А где там якутский? Я его там в упор не вижу.
Ссылка та самая, //ibt.org.ru.
Цитата: bvs от февраля 2, 2016, 20:33Значит, это редкие слова.Цитата: Rwseg от февраля 2, 2016, 01:16Ч встречается в исконных словах (т.е. не русизмах).
Ч 4325 0.51%
Цитата: Rwseg от февраля 2, 2016, 01:16Ч встречается в исконных словах (т.е. не русизмах).
Ч 4325 0.51%
Цитата: Red Khan от февраля 2, 2016, 11:12Ссылка та самая, //ibt.org.ru. Других качественных собраний переводов НЗ на языки РФ я не знаю.
Вы бы ссылку на текст дали.
ibt.org.ru
Цитата: Red Khan от февраля 2, 2016, 11:12Первое правило корпусной лингвистики: чем больше корпус, тем лучше. Второе: чем разнообразнее, тем лучше. А Декларация слишком маленькая и очень узкотематическая. Но и даже на ней закон Зипфа будет работать, ибо закон, мне даже проверять лень, ибо знаю результат заранее, те же самые буквы будут в конце списка.
Я бы посоветовал взять менее традиционный текст, например декларацию о правах человека.
Страница создана за 0.097 сек. Запросов: 24.