Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

«Дефекты» правил русской орфографии и пунктуации 1956 года

Автор qp5547, мая 7, 2013, 18:08

0 Пользователи и 1 гость просматривают эту тему.

qp5547

Считаю целесообразным консолидировать предмет обсуждения, который я затрагивал в нескольких темах:


К чему всё это было? Я программист, руководитель рабочей группы, которая участвует в разработке системы электронных коммуникаций для государственных органов. В задачи нашей группы входит создание программного обеспечения для разных манипуляций с текстом на русском языке. Одно из безусловных требований технического задания — чтобы результаты работы ПО полностью согласовывались с Правилами русской орфографии и пунктуации 1956 года.

Один из наших модулей должен обнаруживать и автоматически исправлять некоторые «простейшие» классы ошибок, вроде отсутствия точки в конце предложения или незакрытых скобок. (Я поставил слово «простейшие» в кавычки, потому что с точки зрения программирования многие из этих ошибок совсем не просты.) Возникла загвоздка с тем, что, согласно текущим регламентам, для каждого класса ошибок ПО должно ссылаться на конкретный пункт Правил, который был нарушен.

Так вот, в случае слитногонаписания слов такого пункта не удалось обнаружить в общем виде. Есть только частные случаи, вроде § 89.1 о том, что «не» с глаголами пишется раздельно. Между тем, в реальных документах, с которыми должна работать наша система, время от времени встречается нечтовродетакого (особенно в текстах, полученных в результате оптического распознавания). Согласитесь, было бы странно, если бы ПО отлавливало ошибки слитного написания в более сложных ситуациях (типа частиц «бы», «ли», «же» или того же «не» с глаголами), а в указанном случае не находило бы никаких проблем.

То же самое касается двойных запятых и других многократных знаков препинания, а такие случаи тоже встречаются в реальных документах.

Я задал соответствующие вопросы на этом форуме, чтобы понять: в Правилах 1956 года действительно нет подходящих инструкций, или просто я их не разглядел? Сначала я консультировался со специалистами по русскому языку, которые входят в наш проект, но они тоже не нашли искомого. Тогда мне посоветовали обратиться на какой-нибудь форум, потому что на форумах обитает множество особей, которые находят удовольствие и смысл существования в том, чтобы указывать другим людям на их ошибки и недостатки. Думаю, если бы я действительно проглядел какое-то правило, мне бы тут на него указали все, кому не лень. Да ещё и объяснили бы, какой я идиот и почему.

Однако подходящих правил так и не нашлось. Следующим шагом, по-видимому, я буду инициировать официальный запрос в Институт русского языка и на основании ответа поднимать вопрос о том, чтобы внести изменения в ТЗ и позволить использовать в качестве нормативных источников не только Правила 1956 года. Благодарю всех собеседников за участие в обсуждениях. Кроме того, что это помогло мне подтвердить свои подозрения, многие реплики меня к тому же весьма позабавили.

И, кстати, про статус Правил, о котором я тоже здесь спрашивал. Я навёл справки по официальным каналам и отыскал все нужные источники. Однако даже самые официальные каналы не помогли найти оснований, на которых сами Правила или утверждающие их документы можно было бы юридически считать нормативно-правовыми актами общего действия. В лучшем случае их статус — локальные НПА, а именно — внутриведомственные нормативы (в пределах, например, АН СССР и подведомственных ей учреждений).

Я буду весьма благодарен, если осмысленные участники этого форума помогут обнаружить другие «дефекты» Правил, которые можно было бы включить в запрос к ИРЯ. Более конкретно, нужны примеры фрагментов текста, которые: а) содержат явные грамматические ошибки с человеческой точки зрения; б) встречаются или хотя бы могут встречаться в реальной практике; в) для которых нельзя указать, какой конкретно пункт Правил 1956 года был нарушен.

На

Цитата: qp5547 от мая  7, 2013, 18:08
не помогли найти оснований, на которых сами Правила или утверждающие их
документы можно было бы юридически считать нормативно-правовыми актами общего
действия.
А они и не являются юридическими актами. ТЗ составленно не корректно.

qp5547

Цитата: На от А они и не являются юридическими актами. ТЗ составленно не корректно.

Составителей ТЗ ничто не обязывало опираться только на юридические акты. Требование, чтобы продукт соответствовал Правилам 1956 года, не нарушает ни законов, ни ГОСТов. Заказчик имел полное право потребовать, например, соответствия не этим Правилам, а вообще каким-нибудь своим собственным (если только они сами по себе не противозаконны).

Юридический статус Правил интересовал меня с той точки зрения, что если бы они действительно были НПА, это осложнило бы мои попытки добиться пересмотра ТЗ.

Red Khan

Скажите, а в "разные манипуляции" входит исправление орфографических ошибок и опечаток?

qp5547

Цитата: Red Khan от Скажите, а в "разные манипуляции" входит исправление орфографических ошибок и опечаток?

Да, если эти ошибки и опечатки можно: а) обнаружить механически (без понимания смысла текста или имитации такого понимания); б) исправить однозначным образом.

Red Khan

Цитата: qp5547 от мая  8, 2013, 12:00
Цитата: Red Khan от Скажите, а в "разные манипуляции" входит исправление орфографических ошибок и опечаток?

Да, если эти ошибки и опечатки можно: а) обнаружить механически (без понимания смысла текста или имитации такого понимания); б) исправить однозначным образом.
А на что ссылается ПО при исправлении ошибок? Я это к чему - возможно слитно написанные слова стоит рассматривать как слова, написанные с ошибками?

Тайльнемер

Цитата: Red Khan от мая  8, 2013, 12:53
возможно слитно написанные слова стоит рассматривать как слова, написанные с ошибками?
+1
На орфографический словарь ссылаться.

qp5547

Цитата: Red от Я это к чему - возможно слитно написанные слова стоит рассматривать как слова, написанные с ошибками?

Так ведь пока нет оснований обнаруживать ошибку. Например, этотслучай, согласно имеющемуся ТЗ, должен интерпретироваться как два слова, причём написанные без ошибок. То, что слова следуют непосредственно друг за другом без какого-либо разделителя,— не ошибка с точки зрения действующих правил.

Red Khan

Цитата: qp5547 от мая  8, 2013, 13:24
Цитата: Red от Я это к чему - возможно слитно написанные слова стоит рассматривать как слова, написанные с ошибками?

Так ведь пока нет оснований обнаруживать ошибку. Например, этотслучай, согласно имеющемуся ТЗ, должен интерпретироваться как два слова, причём написанные без ошибок. То, что слова следуют непосредственно друг за другом без какого-либо разделителя,— не ошибка с точки зрения действующих правил.
В правила включен орфографический словарь? Если я напишу "сабака", на основании чего ПО меня будет исправлять?

qp5547

Цитата: Red Khan от В правила включен орфографический словарь?

Да, в соответствии с приказом Минобрнауки № 195. ТЗ также предусматривает подключение дополнительных словарей допустимых слов вроде имён собственных и специальных терминов.

Toman

Цитата: qp5547 от мая  8, 2013, 13:24
То, что слова следуют непосредственно друг за другом без какого-либо разделителя,— не ошибка с точки зрения действующих правил.
Вообще-то обычно к правилам прилагаются определения терминов и понятий. Нужно определение слова к правилам орфографии. М.б. определение (находящееся как бы вне самих правил, но на котором эти правила основываются) говорит, что слово - это последовательность букв (возможно, с дефисами), отделённое пробелами или знаками препинания? В таком случае согласно этому определению нельзя будет рассматривать написанные слитно два слова как-то иначе, чем одно слово, но, естественно, ошибочное.
Во́зле до́ма хо́лм с куля́ми - вы́йду на́ холм, ку́ль поставлю.
В славном городе Miami тётки мерялись ногтями, тик иң озын завсегда у Фиделя борода!

Red Khan

Цитата: Toman от мая  8, 2013, 14:08
Цитата: qp5547 от мая  8, 2013, 13:24
То, что слова следуют непосредственно друг за другом без какого-либо разделителя,— не ошибка с точки зрения действующих правил.
Вообще-то обычно к правилам прилагаются определения терминов и понятий. Нужно определение слова к правилам орфографии. М.б. определение (находящееся как бы вне самих правил, но на котором эти правила основываются) говорит, что слово - это последовательность букв (возможно, с дефисами), отделённое пробелами или знаками препинания? В таком случае согласно этому определению нельзя будет рассматривать написанные слитно два слова как-то иначе, чем одно слово, но, естественно, ошибочное.
Вот как раз к такому заключению шёл.  :) Нужно определение слова, поскольку слова слитногонаписания, к примеру, нет в орфографическом словаре.

qp5547

С распознаванием отдельных слов в тексте у нашего ПО нет существенных проблем. Если не вдаваться в технические подробности, система пытается делить текст на слова приближённо к тому, как его делил бы среднестатистический грамотный человек. Таким образом, «слитноенаписание» воспринимается как несколько слов (два или более, в зависимости от контекста и некоторых других факторов), поскольку именно так воспринял бы живой читатель.

Но разговор на эту тему уводит от первоначального вопроса. Меня продолжают интересовать возможные примеры, когда с точки зрения здравого смысла в тексте есть грамматическая ошибка, а Правила 1956 года не дают формальных оснований указать на неё.

Беседу об определении слова и других второстепенных вопросах предлагаю желающим продолжать без меня.

Red Khan

Цитата: qp5547 от мая  8, 2013, 17:33
С распознаванием отдельных слов в тексте у нашего ПО нет существенных проблем. Если не вдаваться в технические подробности, система пытается делить текст на слова приближённо к тому, как его делил бы среднестатистический грамотный человек. Таким образом, «слитноенаписание» воспринимается как несколько слов (два или более, в зависимости от контекста и некоторых других факторов), поскольку именно так воспринял бы живой читатель.

Но разговор на эту тему уводит от первоначального вопроса. Меня продолжают интересовать возможные примеры, когда с точки зрения здравого смысла в тексте есть грамматическая ошибка, а Правила 1956 года не дают формальных оснований указать на неё.

Беседу об определении слова и других второстепенных вопросах предлагаю желающим продолжать без меня.
Мы как раз-таки говорим в рамках Вашей проблемы - есть ли в правилах определение что является словом? Используемые ПО орфографические словари - суть список слов же?

kemerover

Цитата: Toman от мая  8, 2013, 14:08
Цитата: qp5547 от мая  8, 2013, 13:24
То, что слова следуют непосредственно друг за другом без какого-либо разделителя,— не ошибка с точки зрения действующих правил.
Вообще-то обычно к правилам прилагаются определения терминов и понятий. Нужно определение слова к правилам орфографии. М.б. определение (находящееся как бы вне самих правил, но на котором эти правила основываются) говорит, что слово - это последовательность букв (возможно, с дефисами), отделённое пробелами или знаками препинания? В таком случае согласно этому определению нельзя будет рассматривать написанные слитно два слова как-то иначе, чем одно слово, но, естественно, ошибочное.
Бабушка-старушка — одно слово?

Валентин Н

Цитата: qp5547 от мая  8, 2013, 17:33
Меня продолжают интересовать возможные примеры, когда с точки зрения здравого смысла в тексте есть грамматическая ошибка, а Правила 1956 года не дают формальных оснований указать на неё.
‮нɐuиɔɐниə ʚʚədх ɯоdwɐmʞɐwи¡
ЗАБАНИЛ ВИКИПЕДИЮ
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı
Препинания авторские!

वरुण

qp5547, ну что делать? Ну не программисты составляли правила 1956 года и не для программистов. Бей гуманитариев.

वरुण - ведийский бог неба, дождя, вод, и верности, правды, космической истины-веры, карает за лож, вранье, грехи против истины-веры. Вращает мироздание, вертит петли вечного цикла жизни-смерти. Он же авестийкая urvąnō душа.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр