Лингвофорум

Общий раздел => Наука и техника => Компьютеры => Тема начата: gasyoun от сентября 16, 2005, 08:11

Название: Эталоны для ABBYY FineReader 7.0
Отправлено: gasyoun от сентября 16, 2005, 08:11
Я вот, ребята, обучаю Ридера читать не только фактуру, но и транслитерацию санскрита - ничего, берет. Да вот только вот какие наиболее часты опечатки:

- "m" как "ri"
- "а под ударением" как "d"
Название: Эталоны для ABYY FineReader 7.0
Отправлено: Лукас от января 29, 2010, 19:13
Есть ли возможность, например, какой-либо лист/страницу (либо весь файл) в формате дежавю или пдф сделать текстовым? И только ли Файн Ридер может это сделать? И есть ли бесплатная программа для такого дела?
Название: Эталоны для ABYY FineReader 7.0
Отправлено: Лукас от января 29, 2010, 19:21
Да еще, какие плюсы и минусы у Файн Ридера 8, 9 и 10 выпусков?
Название: Эталоны для ABYY FineReader 7.0
Отправлено: myst от января 29, 2010, 19:45
Цитата: Лукас от января 29, 2010, 19:13
Есть ли возможность, например, какой-либо лист/страницу (либо весь файл) в формате дежавю или пдф сделать текстовым? И только ли Файн Ридер может это сделать? И есть ли бесплатная программа для такого дела?
Если изображение текста, то нужна программа распознавания. Элементарно же, Ватсон. :)
Название: Эталоны для ABBYY FineReader 7.0
Отправлено: arseniiv от января 29, 2010, 20:07
Кстати, из некоторых djvu-файлов можно текст копировать. Правда, потом придётся подправлять слова, которые перенесены (будут их лишние куски), а может, и ещё что-то.
Название: Эталоны для ABBYY FineReader 7.0
Отправлено: Лукас от января 29, 2010, 20:22
Цитата: myst от января 29, 2010, 19:45
Если изображение текста, то нужна программа распознавания. Элементарно же, Ватсон.
Ну так, Шерлок, это понятно. Есть ли бесплатные программы распознавания или только платные? И мнение по Файн Ридеру нужно.
Название: Эталоны для ABBYY FineReader 7.0
Отправлено: Евгений от января 29, 2010, 20:25
Цитата: arseniiv от января 29, 2010, 20:07
Кстати, из некоторых djvu-файлов можно текст копировать. Правда, потом придётся подправлять слова, которые перенесены (будут их лишние куски), а может, и ещё что-то.
Да, в djvu можно добавлять текстовый слой, так же, как и в pdf.
Название: Эталоны для ABBYY FineReader 7.0
Отправлено: Hellerick от января 29, 2010, 20:35
Цитата: Лукас от января 29, 2010, 20:22
Есть ли бесплатные программы распознавания или только платные?
Есть конечно, да только кому они нужны?

Я несколько текстов обрабатывал программой ABBYY PDF Transformer — в основном, с задачей она справилась.
Название: Эталоны для ABBYY FineReader 7.0
Отправлено: Лукас от января 29, 2010, 20:39
Цитата: Hellerick от января 29, 2010, 20:35
Есть конечно, да только кому они нужны?
Плохие?
Название: Эталоны для ABBYY FineReader 7.0
Отправлено: arseniiv от января 29, 2010, 20:47
Вероятнее всего, так оно и есть. Одна поставлена мне была с офисом 2003. Она читает tiff'ы. Мне не очень понравилось.
Название: Эталоны для ABBYY FineReader 7.0
Отправлено: Dana от января 29, 2010, 21:02
DjVu мне кажется, достаточно lame формат. Хотя по сжатию лучше PDF. И ещё один минус в отсутствии качественных редакторов для него вроде Adobe Acrobat, всё какие-то поделки более или менее кривые.
Но, наверное, такова судьба всех открытых форматов. Да и открытого ПО вообще.
Название: Эталоны для ABBYY FineReader 7.0
Отправлено: myst от января 30, 2010, 04:38
Можно подумать, PDF закрытый.
Название: Эталоны для ABBYY FineReader 7.0
Отправлено: Тайльнемер от января 30, 2010, 08:03
Цитата: Dana от января 29, 2010, 21:02
DjVu ... по сжатию лучше, чем PDF.
Если я не ошибаюсь, здесь дело только в прямоте рук создателей pdf. Ведь djvu — это слой фона, сжатый jpg'ом и наложенный на него слой монохромного рисунка, сжатый каким-то из lossless-методов. В принципе, всё то же самое можно разместить и в pdf, а если учесть, что фоновый слой обычно мало кому нужен, то всё ещё проще.
Название: Эталоны для ABBYY FineReader 7.0
Отправлено: myst от января 30, 2010, 09:05
Цитата: Тайльнемер от января 30, 2010, 08:03
Если я не ошибаюсь, здесь дело только в прямоте рук создателей pdf.
В общем-то, да.