Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Как сделать программу проверки орфографии?

Автор Alessandro, ноября 3, 2006, 21:23

0 Пользователи и 1 гость просматривают эту тему.

Alessandro

Собственно, в этом и вопрос. Как можно сделать словарик для проверки орфографии? Совместимый с Word'ом, например.
Это обычный текстовый файл, в котором прописаны все возможные слова языка во всех возможных формах? Или всё хитрее?
Нет ли какого-нибудь инструмента, которому можно подать на вход словарь и прописать правила грамматики, а он сам сгенерирует словарик для проверки орфографии?

Да, поясню ещё, что меня интересует только орфография. На пунктуацию, грамматику и т.д. я не замахиваюсь.
Спасибо, что дочитали.

Pere

Поглянь на дім свій, Янголе ©

Digamma

Цитата: Alessandro от ноября  3, 2006, 21:23Собственно, в этом и вопрос. Как можно сделать словарик для проверки орфографии? Совместимый с Word'ом, например.
Все приложения MS Office используют единую систему проверки орфографии, которая достаточно сложна - файлы совсем не текстовые, имеют специальный формат, а также дополнительный программный код (это всё связано с тем, что с одной стороны интерфейсы спеллчекеров Microsoft открыты и могут быть использованы любым приложением, а с другой - следуя определённым правилам сторонние производители могут расширять набор полностью (sic!) поддерживаемых языков).

Если Вам это нужно для русского языка (или другого, поддерживаемого Вашим Word-ом), то наиболее удачный вариант будет - это пользовательский словарь (они у приложений Office вполне удобные и расширяемые). Если нет, то нужно подумать, но это точно не текстовый файл...
"Я родился на корабле, но куда он плыл и откуда никто не помнит..."

Alessandro

Цитата: Digamma от ноября  4, 2006, 07:46
Цитата: Alessandro от ноября  3, 2006, 21:23Собственно, в этом и вопрос. Как можно сделать словарик для проверки орфографии? Совместимый с Word'ом, например.
Все приложения MS Office используют единую систему проверки орфографии, которая достаточно сложна - файлы совсем не текстовые, имеют специальный формат, а также дополнительный программный код (это всё связано с тем, что с одной стороны интерфейсы спеллчекеров Microsoft открыты и могут быть использованы любым приложением, а с другой - следуя определённым правилам сторонние производители могут расширять набор полностью (sic!) поддерживаемых языков).

Если Вам это нужно для русского языка (или другого, поддерживаемого Вашим Word-ом), то наиболее удачный вариант будет - это пользовательский словарь (они у приложений Office вполне удобные и расширяемые). Если нет, то нужно подумать, но это точно не текстовый файл...
Нет, речь идёт о крымскотатарском языке. Для него никаких спелчекеров пока не создано. А проблема возникла в связи с катастрофически низким уровнем орфографической грамотности у редакторов крымскотатарских сайтов. Крымскотатарские тексты на сайтах типа //www.bizimqirim.org сплошь пестрят ошибками. Программа проверки орфографии сильно помогла бы.
Спасибо, что дочитали.

Digamma

Цитата: Alessandro от ноября  4, 2006, 09:43Нет, речь идёт о крымскотатарском языке. Для него никаких спелчекеров пока не создано. А проблема возникла в связи с катастрофически низким уровнем орфографической грамотности у редакторов крымскотатарских сайтов. Крымскотатарские тексты на сайтах типа //www.bizimqirim.org сплошь пестрят ошибками. Программа проверки орфографии сильно помогла бы.
Для таких целей лучше воспользоваться сторонними решениями, т.к. создание нового модуля под MS Office отбирает такое количество сил и времени, что вряд ли имеет смысл бесплатное решение на этой платформе.

Попробую на досуге поискать что-нибудь подходящее - может найдётся...
"Я родился на корабле, но куда он плыл и откуда никто не помнит..."

RawonaM

В самом начале, когда форум работал на phpbb скрипте, я встроил в него спеллинг чекер для русского языка, который работал на стороне сервера, просто проверяя слова по списку всех возможных словоформ в базе данных. Это может быть для вас одним из возможных решений (т.е. сделать сайт, на котором будет проверка крымскотатарской орфографии). Ищите среди модов для phpbb (на //phpbb.com), но он работает и сам по себе и с другими форумами тоже. Я лично участвовал в доработке этой программы, чтобы она подходила для проверки русской орфографии, и вы тоже можете связаться с автором для модификации, если понадобится.
Второй вариант — это взять простую програмку, которая сидит в систем-трее и при обращении проверяет орфографию в любой программе. У меня стояла такая для русской и английской орфографии (весила всего около 300 кб), причем русский я добавил в нее сам, взяв готовый список словоформ (обычный текстовый файл), тот же, который я брал для серверного приложения. Вы можете добавить и крымскотатарский язык, если сделаете или найдете готовый список словоформ.

Digamma

Цитата: RawonaM от ноября  4, 2006, 11:44
В самом начале, когда форум работал на phpbb скрипте, я встроил в него спеллинг чекер для русского языка, который работал на стороне сервера, просто проверяя слова по списку всех возможных словоформ в базе данных. Это может быть для вас одним из возможных решений (т.е. сделать сайт, на котором будет проверка крымскотатарской орфографии). Ищите среди модов для phpbb (на //phpbb.com), но он работает и сам по себе и с другими форумами тоже. Я лично участвовал в доработке этой программы, чтобы она подходила для проверки русской орфографии, и вы тоже можете связаться с автором для модификации, если понадобится.
Второй вариант — это взять простую програмку, которая сидит в систем-трее и при обращении проверяет орфографию в любой программе. У меня стояла такая для русской и английской орфографии (весила всего около 300 кб), причем русский я добавил в нее сам, взяв готовый список словоформ (обычный текстовый файл), тот же, который я брал для серверного приложения. Вы можете добавить и крымскотатарский язык, если сделаете или найдете готовый список словоформ.
RawonaM, так при готовом списке словоформ это можно и в MS Office использовать (просто загнать их все в пользовательский словарь для английского, к примеру). Это не как критика, а как вариант.
"Я родился на корабле, но куда он плыл и откуда никто не помнит..."

Alessandro

Цитата: RawonaM от ноября  4, 2006, 11:44Это может быть для вас одним из возможных решений (т.е. сделать сайт, на котором будет проверка крымскотатарской орфографии). Ищите среди модов для phpbb (на //phpbb.com), но он работает и сам по себе и с другими форумами тоже.
Ага, это мысль, спасибо за идею.

Но похоже, что всё всё же упирается в полный список всех словоформ. Хотя, если есть полный список всех слов (а уж без него-то точно никуда), то сегнерировать список всех словоформ вообще можно будет попробовать автоматически. Падежные, глагольные и прочие аффиксы прицепляются к словам по довольно простым правилам.
Спасибо, что дочитали.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр