Хтось зустрічав список префіксів української мови, що не міняють або міняють зміст слова незначно?
Мені в голову приходить тільки по та най. Це потрібно для відкидання префіксів для алгоритму стемізації
Не думаю, що тотожність можлива поза контекстом. Принаймні не очевидно це.
Цитата: MrBTTF от апреля 5, 2018, 09:55
Хтось зустрічав список префіксів української мови, що не міняють або міняють зміст слова незначно?
Мені в голову приходить тільки по та най. Це потрібно для відкидання префіксів для алгоритму стемізації
Що слід розуміти під «незначно»? Якщо це, наприклад, зміна часу дієслова з теперішнього на майбутній (я несу — я понесу), це слід вважати незначною зміною? Йдеться про префікси, які ніколи суттєво не змінюють зміст, чи також і ті, що в частині випадків впливають на зміст, а в частині не впливають?
Поряд з най-, згадуються як- та що- (менший, найменший, якнайменший), хоча в комплексі вони можуть змінювати зміст сказаного на протилежний: «З'їсти менше 5 цукерок»/«З'їсти щонайменше 5 цукерок».
Цитата: MrBTTF от апреля 5, 2018, 09:55
Хтось зустрічав список префіксів української мови, що не міняють або міняють зміст слова незначно?
Мені в голову приходить тільки по та най. Це потрібно для відкидання префіксів для алгоритму стемізації
:) відповідати=відвідати? допомагати=домагати? запобіжник=забіжник? сповідати=свідати?
Цитата: Python от апреля 6, 2018, 06:27
Цитата: MrBTTF от апреля 5, 2018, 09:55
Хтось зустрічав список префіксів української мови, що не міняють або міняють зміст слова незначно?
Мені в голову приходить тільки по та най. Це потрібно для відкидання префіксів для алгоритму стемізації
Що слід розуміти під «незначно»? Якщо це, наприклад, зміна часу дієслова з теперішнього на майбутній (я несу — я понесу), це слід вважати незначною зміною? Йдеться про префікси, які ніколи суттєво не змінюють зміст, чи також і ті, що в частині випадків впливають на зміст, а в частині не впливають?
Поряд з най-, згадуються як- та що- (менший, найменший, якнайменший), хоча в комплексі вони можуть змінювати зміст сказаного на протилежний: «З'їсти менше 5 цукерок»/«З'їсти щонайменше 5 цукерок».
Ідеться про префікси, які несуттєво змінють сенс слова для задачі пошуку слова в тексті за стемом. Стемізація відбувається без інформації про сусідні слова. Зрозуміло, що абсолютно правильно отримати стем без контексту неможливо, але, очевидно, префікси
по та
най не змінюють сенс до протилежного. Для випадку
несу — понесу, насамперед, при пошуку нас цікавить дія
нести, а не час, тому маємо стем
нес.
У вашому прикладі з цукерками можливо непотрібно відкидати префікс
щонай у прислівників, який якраз і дає протилежне значення
щонайменше = не менше, але
щонайменший != не менший.
Цитата: Sirko от апреля 6, 2018, 13:25
Цитата: MrBTTF от апреля 5, 2018, 09:55
Хтось зустрічав список префіксів української мови, що не міняють або міняють зміст слова незначно?
Мені в голову приходить тільки по та най. Це потрібно для відкидання префіксів для алгоритму стемізації
:) відповідати=відвідати? допомагати=домагати? запобіжник=забіжник? сповідати=свідати?
Відкидання відбуватиметься обов'язково з початку слова. Префікс
від усе таки суттєво змінює значення, так що до
по не дійде :yes: