Лингвофорум

Русский язык => Вопросы по русскому языку => Тема начата: qp5547 от мая 7, 2013, 18:08

Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: qp5547 от мая 7, 2013, 18:08
Считаю целесообразным консолидировать предмет обсуждения, который я затрагивал в нескольких темах:


К чему всё это было? Я программист, руководитель рабочей группы, которая участвует в разработке системы электронных коммуникаций для государственных органов. В задачи нашей группы входит создание программного обеспечения для разных манипуляций с текстом на русском языке. Одно из безусловных требований технического задания — чтобы результаты работы ПО полностью согласовывались с Правилами русской орфографии и пунктуации 1956 года.

Один из наших модулей должен обнаруживать и автоматически исправлять некоторые «простейшие» классы ошибок, вроде отсутствия точки в конце предложения или незакрытых скобок. (Я поставил слово «простейшие» в кавычки, потому что с точки зрения программирования многие из этих ошибок совсем не просты.) Возникла загвоздка с тем, что, согласно текущим регламентам, для каждого класса ошибок ПО должно ссылаться на конкретный пункт Правил, который был нарушен.

Так вот, в случае слитногонаписания слов такого пункта не удалось обнаружить в общем виде. Есть только частные случаи, вроде § 89.1 о том, что «не» с глаголами пишется раздельно. Между тем, в реальных документах, с которыми должна работать наша система, время от времени встречается нечтовродетакого (особенно в текстах, полученных в результате оптического распознавания). Согласитесь, было бы странно, если бы ПО отлавливало ошибки слитного написания в более сложных ситуациях (типа частиц «бы», «ли», «же» или того же «не» с глаголами), а в указанном случае не находило бы никаких проблем.

То же самое касается двойных запятых и других многократных знаков препинания, а такие случаи тоже встречаются в реальных документах.

Я задал соответствующие вопросы на этом форуме, чтобы понять: в Правилах 1956 года действительно нет подходящих инструкций, или просто я их не разглядел? Сначала я консультировался со специалистами по русскому языку, которые входят в наш проект, но они тоже не нашли искомого. Тогда мне посоветовали обратиться на какой-нибудь форум, потому что на форумах обитает множество особей, которые находят удовольствие и смысл существования в том, чтобы указывать другим людям на их ошибки и недостатки. Думаю, если бы я действительно проглядел какое-то правило, мне бы тут на него указали все, кому не лень. Да ещё и объяснили бы, какой я идиот и почему.

Однако подходящих правил так и не нашлось. Следующим шагом, по-видимому, я буду инициировать официальный запрос в Институт русского языка и на основании ответа поднимать вопрос о том, чтобы внести изменения в ТЗ и позволить использовать в качестве нормативных источников не только Правила 1956 года. Благодарю всех собеседников за участие в обсуждениях. Кроме того, что это помогло мне подтвердить свои подозрения, многие реплики меня к тому же весьма позабавили.

И, кстати, про статус Правил, о котором я тоже здесь спрашивал (http://lingvoforum.net/index.php/topic,56770.0.html). Я навёл справки по официальным каналам и отыскал все нужные источники. Однако даже самые официальные каналы не помогли найти оснований, на которых сами Правила или утверждающие их документы можно было бы юридически считать нормативно-правовыми актами общего действия. В лучшем случае их статус — локальные НПА, а именно — внутриведомственные нормативы (в пределах, например, АН СССР и подведомственных ей учреждений).

Я буду весьма благодарен, если осмысленные участники этого форума помогут обнаружить другие «дефекты» Правил, которые можно было бы включить в запрос к ИРЯ. Более конкретно, нужны примеры фрагментов текста, которые: а) содержат явные грамматические ошибки с человеческой точки зрения; б) встречаются или хотя бы могут встречаться в реальной практике; в) для которых нельзя указать, какой конкретно пункт Правил 1956 года был нарушен.
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: На от мая 7, 2013, 18:24
Цитата: qp5547 от мая  7, 2013, 18:08
не помогли найти оснований, на которых сами Правила или утверждающие их
документы можно было бы юридически считать нормативно-правовыми актами общего
действия.
А они и не являются юридическими актами. ТЗ составленно не корректно.
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: qp5547 от мая 7, 2013, 18:36
Цитата: На от А они и не являются юридическими актами. ТЗ составленно не корректно.

Составителей ТЗ ничто не обязывало опираться только на юридические акты. Требование, чтобы продукт соответствовал Правилам 1956 года, не нарушает ни законов, ни ГОСТов. Заказчик имел полное право потребовать, например, соответствия не этим Правилам, а вообще каким-нибудь своим собственным (если только они сами по себе не противозаконны).

Юридический статус Правил интересовал меня с той точки зрения, что если бы они действительно были НПА, это осложнило бы мои попытки добиться пересмотра ТЗ.
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: Red Khan от мая 8, 2013, 02:59
Скажите, а в "разные манипуляции" входит исправление орфографических ошибок и опечаток?
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: qp5547 от мая 8, 2013, 12:00
Цитата: Red Khan от Скажите, а в "разные манипуляции" входит исправление орфографических ошибок и опечаток?

Да, если эти ошибки и опечатки можно: а) обнаружить механически (без понимания смысла текста или имитации такого понимания); б) исправить однозначным образом.
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: Red Khan от мая 8, 2013, 12:53
Цитата: qp5547 от мая  8, 2013, 12:00
Цитата: Red Khan от Скажите, а в "разные манипуляции" входит исправление орфографических ошибок и опечаток?

Да, если эти ошибки и опечатки можно: а) обнаружить механически (без понимания смысла текста или имитации такого понимания); б) исправить однозначным образом.
А на что ссылается ПО при исправлении ошибок? Я это к чему - возможно слитно написанные слова стоит рассматривать как слова, написанные с ошибками?
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: Тайльнемер от мая 8, 2013, 13:00
Цитата: Red Khan от мая  8, 2013, 12:53
возможно слитно написанные слова стоит рассматривать как слова, написанные с ошибками?
+1
На орфографический словарь ссылаться.
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: qp5547 от мая 8, 2013, 13:24
Цитата: Red от Я это к чему - возможно слитно написанные слова стоит рассматривать как слова, написанные с ошибками?

Так ведь пока нет оснований обнаруживать ошибку. Например, этотслучай, согласно имеющемуся ТЗ, должен интерпретироваться как два слова, причём написанные без ошибок. То, что слова следуют непосредственно друг за другом без какого-либо разделителя,— не ошибка с точки зрения действующих правил.
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: Red Khan от мая 8, 2013, 13:31
Цитата: qp5547 от мая  8, 2013, 13:24
Цитата: Red от Я это к чему - возможно слитно написанные слова стоит рассматривать как слова, написанные с ошибками?

Так ведь пока нет оснований обнаруживать ошибку. Например, этотслучай, согласно имеющемуся ТЗ, должен интерпретироваться как два слова, причём написанные без ошибок. То, что слова следуют непосредственно друг за другом без какого-либо разделителя,— не ошибка с точки зрения действующих правил.
В правила включен орфографический словарь? Если я напишу "сабака", на основании чего ПО меня будет исправлять?
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: qp5547 от мая 8, 2013, 13:45
Цитата: Red Khan от В правила включен орфографический словарь?

Да, в соответствии с приказом Минобрнауки № 195 (http://base.garant.ru/196093/). ТЗ также предусматривает подключение дополнительных словарей допустимых слов вроде имён собственных и специальных терминов.
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: Toman от мая 8, 2013, 14:08
Цитата: qp5547 от мая  8, 2013, 13:24
То, что слова следуют непосредственно друг за другом без какого-либо разделителя,— не ошибка с точки зрения действующих правил.
Вообще-то обычно к правилам прилагаются определения терминов и понятий. Нужно определение слова к правилам орфографии. М.б. определение (находящееся как бы вне самих правил, но на котором эти правила основываются) говорит, что слово - это последовательность букв (возможно, с дефисами), отделённое пробелами или знаками препинания? В таком случае согласно этому определению нельзя будет рассматривать написанные слитно два слова как-то иначе, чем одно слово, но, естественно, ошибочное.
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: Red Khan от мая 8, 2013, 14:16
Цитата: Toman от мая  8, 2013, 14:08
Цитата: qp5547 от мая  8, 2013, 13:24
То, что слова следуют непосредственно друг за другом без какого-либо разделителя,— не ошибка с точки зрения действующих правил.
Вообще-то обычно к правилам прилагаются определения терминов и понятий. Нужно определение слова к правилам орфографии. М.б. определение (находящееся как бы вне самих правил, но на котором эти правила основываются) говорит, что слово - это последовательность букв (возможно, с дефисами), отделённое пробелами или знаками препинания? В таком случае согласно этому определению нельзя будет рассматривать написанные слитно два слова как-то иначе, чем одно слово, но, естественно, ошибочное.
Вот как раз к такому заключению шёл.  :) Нужно определение слова, поскольку слова слитногонаписания, к примеру, нет в орфографическом словаре.
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: qp5547 от мая 8, 2013, 17:33
С распознаванием отдельных слов в тексте у нашего ПО нет существенных проблем. Если не вдаваться в технические подробности, система пытается делить текст на слова приближённо к тому, как его делил бы среднестатистический грамотный человек. Таким образом, «слитноенаписание» воспринимается как несколько слов (два или более, в зависимости от контекста и некоторых других факторов), поскольку именно так воспринял бы живой читатель.

Но разговор на эту тему уводит от первоначального вопроса. Меня продолжают интересовать возможные примеры, когда с точки зрения здравого смысла в тексте есть грамматическая ошибка, а Правила 1956 года не дают формальных оснований указать на неё.

Беседу об определении слова и других второстепенных вопросах предлагаю желающим продолжать без меня.
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: Red Khan от мая 8, 2013, 18:21
Цитата: qp5547 от мая  8, 2013, 17:33
С распознаванием отдельных слов в тексте у нашего ПО нет существенных проблем. Если не вдаваться в технические подробности, система пытается делить текст на слова приближённо к тому, как его делил бы среднестатистический грамотный человек. Таким образом, «слитноенаписание» воспринимается как несколько слов (два или более, в зависимости от контекста и некоторых других факторов), поскольку именно так воспринял бы живой читатель.

Но разговор на эту тему уводит от первоначального вопроса. Меня продолжают интересовать возможные примеры, когда с точки зрения здравого смысла в тексте есть грамматическая ошибка, а Правила 1956 года не дают формальных оснований указать на неё.

Беседу об определении слова и других второстепенных вопросах предлагаю желающим продолжать без меня.
Мы как раз-таки говорим в рамках Вашей проблемы - есть ли в правилах определение что является словом? Используемые ПО орфографические словари - суть список слов же?
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: kemerover от мая 8, 2013, 18:32
Цитата: Toman от мая  8, 2013, 14:08
Цитата: qp5547 от мая  8, 2013, 13:24
То, что слова следуют непосредственно друг за другом без какого-либо разделителя,— не ошибка с точки зрения действующих правил.
Вообще-то обычно к правилам прилагаются определения терминов и понятий. Нужно определение слова к правилам орфографии. М.б. определение (находящееся как бы вне самих правил, но на котором эти правила основываются) говорит, что слово - это последовательность букв (возможно, с дефисами), отделённое пробелами или знаками препинания? В таком случае согласно этому определению нельзя будет рассматривать написанные слитно два слова как-то иначе, чем одно слово, но, естественно, ошибочное.
Бабушка-старушка — одно слово?
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: Валентин Н от июня 5, 2013, 17:50
Цитата: qp5547 от мая  8, 2013, 17:33
Меня продолжают интересовать возможные примеры, когда с точки зрения здравого смысла в тексте есть грамматическая ошибка, а Правила 1956 года не дают формальных оснований указать на неё.
‮нɐuиɔɐниə ʚʚədх ɯоdwɐmʞɐwи¡
Название: «Дефекты» правил русской орфографии и пунктуации 1956 года
Отправлено: वरुण от июня 5, 2013, 19:21
qp5547, ну что делать? Ну не программисты составляли правила 1956 года и не для программистов. Бей гуманитариев.