Лингвофорум

Теоретический раздел => Индоевропейские языки => Русский язык => Тема начата: novikovag от марта 26, 2019, 21:54

Название: Помочь перевести "Русский семантический словарь" в текстовый вид есть желающие?
Отправлено: novikovag от марта 26, 2019, 21:54
Сабж
:UU:
Название: Помочь перевести "Русский семантический словарь" в текстовый вид есть желающие?
Отправлено: Bhudh от марта 26, 2019, 23:59
На FineReader скинуться, что ли? :eat:
Название: Помочь перевести "Русский семантический словарь" в текстовый вид есть желающие?
Отправлено: novikovag от марта 27, 2019, 01:01
Цитата: Bhudh от марта 26, 2019, 23:59
На FineReader скинуться, что ли? :eat:
Не, все уже более мене распознано. Я подчищаю в полуавтоматическом режиме и если у кого то будут предложения по форматированию, найдены ошибки и т.п. то велком, ссылка на словарь

Словарь (https://github.com/novikovag/OCR/tree/master/%D0%A0%D1%83%D1%81%D1%81%D0%BA%D0%B8%D0%B9%20%D1%81%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9%20%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C)
Название: Помочь перевести "Русский семантический словарь" в текстовый вид есть желающие?
Отправлено: Bhudh от марта 27, 2019, 06:00
Это Вам "¬\r\n" на "" заменить надо, что ли?
Там работы на пару регулярок.
Название: Помочь перевести "Русский семантический словарь" в текстовый вид есть желающие?
Отправлено: novikovag от марта 27, 2019, 16:55
Цитата: Bhudh от марта 27, 2019, 06:00
Это Вам "¬\r\n" на "" заменить надо, что ли?
Там работы на пару регулярок.
Да нет же, там например куча слов у которых знак ударения над о распознан как буква б.