Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Определение авторства текста

Автор Alone Coder, июня 22, 2012, 13:21

0 Пользователи и 1 гость просматривают эту тему.

Alone Coder

Какие математические методы сейчас используются для сабжа и насколько хорошо они работают?

RawonaM

Quel timing parfait. :)

Je dois écrire un travail sur ce sujet (je l'ai choisi).

"Character N-Grams" est le plus facile et marche pas mal.

Alone Coder

Но для текстов одного автора на разные темы это не сработает.
Как и для набора текстов на одну тему от разных авторов.

Alone Coder

А никто не пробовал убрать всю словарную информацию и сравнивать только синтаксическую?


Alone Coder

Очень интересная статья. А как бы это всё пощупать? Например, можно ли определить, кому принадлежит поэма "Гавриилиада" - автору поэмы "Жила девица Катерина..." или автору поэмы "Монах"? Естественно, с кучкой других поэтов для контроля.

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

RawonaM

Essayez char n-gram, c'est très facile à implémenter.
Savez-vous quelque chose sur data mining?
Divisez votre data à train et test 90-10.

Alone Coder

Там всего около 1000 слов во всём тексте. Некуда делить.
Странно, если до сих пор нет готовых программ.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр