Лингвофорум

Общий раздел => Наука и техника => Компьютеры => Тема начата: Alessandro от ноября 3, 2006, 21:23

Название: Как сделать программу проверки орфографии?
Отправлено: Alessandro от ноября 3, 2006, 21:23
Собственно, в этом и вопрос. Как можно сделать словарик для проверки орфографии? Совместимый с Word'ом, например.
Это обычный текстовый файл, в котором прописаны все возможные слова языка во всех возможных формах? Или всё хитрее?
Нет ли какого-нибудь инструмента, которому можно подать на вход словарь и прописать правила грамматики, а он сам сгенерирует словарик для проверки орфографии?

Да, поясню ещё, что меня интересует только орфография. На пунктуацию, грамматику и т.д. я не замахиваюсь.
Название: Re: Как сделать программу проверки орфографии?
Отправлено: Pere от ноября 3, 2006, 22:57
Вот нечто близкое по тематике, но для английского языка
http://web.media.mit.edu/~hugo/conceptnet/
Название: Как сделать программу проверки орфографии?
Отправлено: Digamma от ноября 4, 2006, 07:46
Цитата: Alessandro от ноября  3, 2006, 21:23Собственно, в этом и вопрос. Как можно сделать словарик для проверки орфографии? Совместимый с Word'ом, например.
Все приложения MS Office используют единую систему проверки орфографии, которая достаточно сложна - файлы совсем не текстовые, имеют специальный формат, а также дополнительный программный код (это всё связано с тем, что с одной стороны интерфейсы спеллчекеров Microsoft открыты и могут быть использованы любым приложением, а с другой - следуя определённым правилам сторонние производители могут расширять набор полностью (sic!) поддерживаемых языков).

Если Вам это нужно для русского языка (или другого, поддерживаемого Вашим Word-ом), то наиболее удачный вариант будет - это пользовательский словарь (они у приложений Office вполне удобные и расширяемые). Если нет, то нужно подумать, но это точно не текстовый файл...
Название: Как сделать программу проверки орфографии?
Отправлено: Alessandro от ноября 4, 2006, 09:43
Цитата: Digamma от ноября  4, 2006, 07:46
Цитата: Alessandro от ноября  3, 2006, 21:23Собственно, в этом и вопрос. Как можно сделать словарик для проверки орфографии? Совместимый с Word'ом, например.
Все приложения MS Office используют единую систему проверки орфографии, которая достаточно сложна - файлы совсем не текстовые, имеют специальный формат, а также дополнительный программный код (это всё связано с тем, что с одной стороны интерфейсы спеллчекеров Microsoft открыты и могут быть использованы любым приложением, а с другой - следуя определённым правилам сторонние производители могут расширять набор полностью (sic!) поддерживаемых языков).

Если Вам это нужно для русского языка (или другого, поддерживаемого Вашим Word-ом), то наиболее удачный вариант будет - это пользовательский словарь (они у приложений Office вполне удобные и расширяемые). Если нет, то нужно подумать, но это точно не текстовый файл...
Нет, речь идёт о крымскотатарском языке. Для него никаких спелчекеров пока не создано. А проблема возникла в связи с катастрофически низким уровнем орфографической грамотности у редакторов крымскотатарских сайтов. Крымскотатарские тексты на сайтах типа www.bizimqirim.org сплошь пестрят ошибками. Программа проверки орфографии сильно помогла бы.
Название: Как сделать программу проверки орфографии?
Отправлено: Digamma от ноября 4, 2006, 11:15
Цитата: Alessandro от ноября  4, 2006, 09:43Нет, речь идёт о крымскотатарском языке. Для него никаких спелчекеров пока не создано. А проблема возникла в связи с катастрофически низким уровнем орфографической грамотности у редакторов крымскотатарских сайтов. Крымскотатарские тексты на сайтах типа www.bizimqirim.org сплошь пестрят ошибками. Программа проверки орфографии сильно помогла бы.
Для таких целей лучше воспользоваться сторонними решениями, т.к. создание нового модуля под MS Office отбирает такое количество сил и времени, что вряд ли имеет смысл бесплатное решение на этой платформе.

Попробую на досуге поискать что-нибудь подходящее - может найдётся...
Название: Re: Как сделать программу проверки орфографии?
Отправлено: RawonaM от ноября 4, 2006, 11:44
В самом начале, когда форум работал на phpbb скрипте, я встроил в него спеллинг чекер для русского языка, который работал на стороне сервера, просто проверяя слова по списку всех возможных словоформ в базе данных. Это может быть для вас одним из возможных решений (т.е. сделать сайт, на котором будет проверка крымскотатарской орфографии). Ищите среди модов для phpbb (на phpbb.com), но он работает и сам по себе и с другими форумами тоже. Я лично участвовал в доработке этой программы, чтобы она подходила для проверки русской орфографии, и вы тоже можете связаться с автором для модификации, если понадобится.
Второй вариант — это взять простую програмку, которая сидит в систем-трее и при обращении проверяет орфографию в любой программе. У меня стояла такая для русской и английской орфографии (весила всего около 300 кб), причем русский я добавил в нее сам, взяв готовый список словоформ (обычный текстовый файл), тот же, который я брал для серверного приложения. Вы можете добавить и крымскотатарский язык, если сделаете или найдете готовый список словоформ.
Название: Re: Как сделать программу проверки орфографии?
Отправлено: Digamma от ноября 4, 2006, 12:42
Цитата: RawonaM от ноября  4, 2006, 11:44
В самом начале, когда форум работал на phpbb скрипте, я встроил в него спеллинг чекер для русского языка, который работал на стороне сервера, просто проверяя слова по списку всех возможных словоформ в базе данных. Это может быть для вас одним из возможных решений (т.е. сделать сайт, на котором будет проверка крымскотатарской орфографии). Ищите среди модов для phpbb (на phpbb.com), но он работает и сам по себе и с другими форумами тоже. Я лично участвовал в доработке этой программы, чтобы она подходила для проверки русской орфографии, и вы тоже можете связаться с автором для модификации, если понадобится.
Второй вариант — это взять простую програмку, которая сидит в систем-трее и при обращении проверяет орфографию в любой программе. У меня стояла такая для русской и английской орфографии (весила всего около 300 кб), причем русский я добавил в нее сам, взяв готовый список словоформ (обычный текстовый файл), тот же, который я брал для серверного приложения. Вы можете добавить и крымскотатарский язык, если сделаете или найдете готовый список словоформ.
RawonaM, так при готовом списке словоформ это можно и в MS Office использовать (просто загнать их все в пользовательский словарь для английского, к примеру). Это не как критика, а как вариант.
Название: Re: Как сделать программу проверки орфографии?
Отправлено: Alessandro от ноября 4, 2006, 23:11
Цитата: RawonaM от ноября  4, 2006, 11:44Это может быть для вас одним из возможных решений (т.е. сделать сайт, на котором будет проверка крымскотатарской орфографии). Ищите среди модов для phpbb (на phpbb.com), но он работает и сам по себе и с другими форумами тоже.
Ага, это мысль, спасибо за идею.

Но похоже, что всё всё же упирается в полный список всех словоформ. Хотя, если есть полный список всех слов (а уж без него-то точно никуда), то сегнерировать список всех словоформ вообще можно будет попробовать автоматически. Падежные, глагольные и прочие аффиксы прицепляются к словам по довольно простым правилам.