Текст взят отсюда: http://by-mova.livejournal.com/1099892.html
Корпус мае 1945 тэкстаў (~15 млн. словаўжыванняў) мастацкай літаратуры (проза і вершы) з граматычнай разметкай і пашпартызацыяй (аўтар, назва твора і г.д.). Планаваны аб'ём корпусу – 100 млн. словаўжыванняў.
Лексіка-граматычная база даступная на ўмовах ліцэнзіі Creative Commons Attribution/Share-Alike 3.0.
Рухавік будзе даступны на ўмовах ліцензіі GNU General Public License, Version 3.
Вітаецца любая дапамога: прапановы і крытычныя заўвагі, вычытаныя тэксты (з выходнымі звесткамі), дапамога ў зняцці аманіміі і інш.
Дасылайце лісты на bnkorpus@gmail.com
http://bnkorpus.info/
Перевод верхнего текста на "общепонятный".
Корпус состоит из 1945 текстов (~15 млн. словоупотреблений) художественной литературы (проза и стихи) с грамматической разметкой и паспортизацией (автор, название произведения и т.д.). Планируемый объем корпуса - 100 млн. словоупотреблений.
Лексико-грамматическая база доступна на условиях лицензии Creative Commons Attribution/Share-Alike 3.0.
Движок будет доступен на условиях лицензии GNU General Public License, Version 3.
Приветствуется любая помощь: предложения и критические замечания, вычитанные тексты (с выходными данными), помощь в снятии омонимии и др.
Шлите письма на bnkorpus@gmail.com
http://bnkorpus.info/ (http://bnkorpus.info/)
Іншыя корпусы беларускай мовы: корпус навуковых тэкстаў Corpus Albaruthenicum (http://grid.bntu.by/corpus/ (http://grid.bntu.by/corpus/)), паралельны беларуска-руска-беларускі корпус на сайце Нацыянальнага корпусу рускай мовы (http://ruscorpora.ru/search-para-be.html (http://ruscorpora.ru/search-para-be.html)).
Обновление корпуса.
Корпусмае больш за 50 тысяч тэкстаў (~30 млн. словаўжыванняў) мастацкай літаратуры (проза і вершы) і публіцыстыкі з граматычнай разметкай і пашпартызацыяй (аўтар, назва твора і г.д.). Планаваны аб'ём корпусу – 100 млн. словаўжыванняў.