Лингвофорум

Local boards - Разделы на разных языках => Український форум => Ресурси => Тема начата: Sirko от января 25, 2015, 16:49

Название: Шукаю синтаксично розмічений корпус української мови
Отправлено: Sirko от января 25, 2015, 16:49
 :srch:
Название: Шукаю синтаксично розмічений корпус української мови
Отправлено: kissarat от февраля 20, 2015, 03:05
В вам для чого?
Название: Шукаю синтаксично розмічений корпус української мови
Отправлено: Sirko от февраля 20, 2015, 07:27
Цитата: kissarat от февраля 20, 2015, 03:05
В вам для чого?
Для парсингу.
http://nlp.stanford.edu:8080/parser/
Название: Шукаю синтаксично розмічений корпус української мови
Отправлено: DarkMax2 от февраля 20, 2015, 08:58
Що це і як має виглядати?
Название: Шукаю синтаксично розмічений корпус української мови
Отправлено: Sirko от февраля 20, 2015, 12:06
Цитата: DarkMax2 от февраля 20, 2015, 08:58
Що це і як має виглядати?
Нерозмічене речення: My dog also likes eating sausage.
Це звичайне речення.

Теговане речення: My/PRP$ dog/NN also/RB likes/VBZ eating/VBG sausage/NN ./.
Це морфологічно розмічене речення, в якому кожне слово теговане, тобто позначене тегами-помітками, що містять інформацію про частину мови, число, рід, відмінок, час, перехідність, тощо. Також приводиться лематизована форма слова (напр., чол. рід однини у н. в. для прикметників чи інфінітив для дієслів).

Синтаксично розмічене речення:
(ROOT
  (S
    (NP (PRP$ My) (NN dog))
    (ADVP (RB also))
    (VP (VBZ likes)
      (S
        (VP (VBG eating)
          (NP (NN sausage)))))
    (. .)))
Містить інформацію про синтаксичну структуру речення.  Тут S позначає речення, NP - іменникове, VP - дієслівне, ADVP - прислівникове,  PP - прийменникове словосполучення.
Название: Шукаю синтаксично розмічений корпус української мови
Отправлено: kissarat от февраля 20, 2015, 12:16
А парсити для чого?)
Название: Шукаю синтаксично розмічений корпус української мови
Отправлено: Sirko от февраля 28, 2015, 19:06
Цитата: kissarat от февраля 20, 2015, 12:16
А парсити для чого?)
Видобування даних
Машинний переклад
Питально-відповідальні системи
Інформаційний пошук
Отримання інформації
Спрощення тексту
Технологія перекладу
Автоматичне реферування (https://uk.wikipedia.org/wiki/%D0%9E%D0%B1%D1%80%D0%BE%D0%B1%D0%BA%D0%B0_%D0%BF%D1%80%D0%B8%D1%80%D0%BE%D0%B4%D0%BD%D0%BE%D1%97_%D0%BC%D0%BE%D0%B2%D0%B8)
Название: Шукаю синтаксично розмічений корпус української мови
Отправлено: Sirko от февраля 28, 2015, 19:10
Хтось має можливість запустити команду
aspell -d uk dump master | aspell -l uk expand > my.dict
й поділитися результатом?  :)