Решил создать список татарских стоп-слов в духе NLTK. За основу взял из NLTK список турецких стоп-слов. Вот он: aslında, çok, en, ve, niye, diye, nerde, az, birşey, nereye, hep, her, acaba, siz, ne, bazı, biri, daha, çünkü, hem, mı, eğer, hepsi, şey, şu, sanki, ya, tüm, de, niçin, gibi, bu, defa, biz, kez, kim, da, belki, veya, ile, nerede, ama, ki, için, o, mu,
neden, hiç, birkaç, mü, yani, ise, nasıl.
К сожалению, я не владею турецким, и у меня возникла проблема со словом birşey. Лингво такого слова не знает. Может в NLTK ошибка, и подразумевалось bir şey? Просветите неуча, пожалуйста...