Подкиньте программку под Windows XP, которая сравнит два отсортированных текстовых файла типа
file1.txt:
А
Б
В
Д
file2.txt:
А
В
Г
И даст результат в виде:
-Б
+Г
-Д
fc ushakov_words_nodup.txt ozhegov_words_sort_nodup.txt > fc.txt
сравнил меньше половины.
fc /lb100000 ushakov_words_nodup.txt ozhegov_words_sort_nodup.txt > fc.txt
повис.
И вообще, выводит в таком адском порядке, что нужный мне из него не получить.
Иначе я не смогу узнать, какие слова только изменили написание от Ушакова к Ожегову!
diff -u ushakov_words_nodup.txt ozhegov_words_sort_nodup.txt > diff_u.txt
даёт примерно то, что нужно, только добавляет одинаковые строки.
Скачайте sed (например, вместе с unxutils) и попробуйте следующее:
diff -u ushakov_words_nodup.txt ozhegov_words_sort_nodup.txt | sed "/^[+\-]/!d" > diff_u_sed.txt
Словник Ушакова (включая заголовки мелким шрифтом) - 85582 слов.
Словник Ожегова-Шведовой 1992 - 39619 слов.
Всё не считая одинаковых заголовков для вторых значений.
Excel подавился.
Написать велосипед быстрее, чем найти в точности то, что нужно. Вы же кодер :)
Цитата: Alone Coder от августа 13, 2012, 08:50Подкиньте программку под Windows XP, которая сравнит два отсортированных текстовых файла
WinMerge.
Плюсы и минусы будут видны в виде подсветки, что, Ι℧, удобнее.
Нет, подсветку нельзя редактировать. Я уже сделал один проход по полученному списку. Ещё никогда не работал с такими большими списками. В исходных текстах было чудовищное количество опечаток. У Ушакова вообще отрезали статьи с середины и пихали в другой конец документа. Многие статьи пока не нашёл, хотя ссылки на них есть.
Цитата: Alone Coder от августа 13, 2012, 10:44
Excel подавился.
Странно. Вроде бы, для него это простейшая задача.
Словники не подкинете?
Текущая версия (исправляю по мере нахождения опечаток):
Цитата: Hellerick от августа 14, 2012, 07:35
Странно. Вроде бы, для него это простейшая задача.
Больше 65536 строк не умеет.
Цитата: Alone Coder от августа 14, 2012, 07:39
Цитата: Hellerick от августа 14, 2012, 07:35
Странно. Вроде бы, для него это простейшая задача.
Больше 65536 строк не умеет.
У меня этих строк 1048576 ;)
Составил список пар слов, которые стоят рядом по алфавиту, находятся в разных словарях, и имеют между собой расстояние Левенштейна равное единице.
Правда, там мусор в основном. Но есть и интересные пары.
Забавный инструмент!
А вот что я накопал вручную: оказывается, словарь Ожегова вовсе не такой уж маленький! Просто заглавные слова из Ушакова попали внутрь статей. Например:
-АА
-АБАЗ
-АБАКА
+АБАЗИНСКИЙ
+АБАЗИНЫ
*АББАТИССА>АББАТИСА
-АББАТСКИЙ (ушло в ст. "аббат")
-АБЕРАЦИОННЫЙ/АБЕРРАЦИОННЫЙ (ушло в ст. "аберрация")
*АБЕРАЦИЯ/АБЕРРАЦИЯ>АБЕРРАЦИЯ
*АБРЕВИАТУРА/АБРЕВИАЦИЯ>АББРЕВИАТУРА
+АБИССИНЦЫ (у Ушакова было в толковании ст. "эфиоп")
-АБОНЕМЕНТНЫЙ (ушло в ст. "абонемент")
!АБОНЕНТНЫЙ>абонентский (в ст. "абонент")
-АБОНИРОВАННЫЙ (хотя осталось "абонировать")
-АБОНИРОВАТЬСЯ (хотя осталось "абонировать")
-АБОРДАЖНЫЙ (ушло в ст. "абордаж")
-АБОРДИРОВАТЬ
-АБОРДИРОВАТЬСЯ
+АБОРИГЕННЫЙ
+АБРАЗИВ (!!!)
-АБРИКОСНЫЙ (ушло в ст. "абрикос")
-АБРИКОСОВКА
-АБРИКОТИН
-АБСЕНТ (!!!)
-АБСЕНТЕИСТ (хотя осталось "абсентеизм" и к нему "абсентеистский")
-АБСОЛЮТИСТ (хотя осталось "абсолютизм" и к нему "абсолютистский")
-АБСОЛЮТИСТСКИЙ (ушло в ст. "абсолютизм")
-АБСОЛЮТНО (ушло в ст. "абсолютный")
-АБСОЛЮТНОСТЬ (ушло в ст. "абсолютный")
-АБСОРБИРОВАТЬ
-АБСОРБИРОВАТЬСЯ
-АБСОРБЦИЯ (!!!)
-АБСТРАКТНОСТЬ (ушло в ст. "абстрактный")
+АБСТРАКЦИОНИЗМ
+АБСТРАКЦИОНИСТ
-АБСУРДНОСТЬ (ушло в ст. "абсурдный")
-АБСЦИССА (!!!)
-АБУЛИЯ
-АБЦУГ
+АБХАЗСКИЙ (у Ушакова было в примере к ст. "гибрид" и в толковании к ст. "лазы")
+АБХАЗСКО-АДЫГЕЙСКИЙ
+АБХАЗЫ
+АБЫ (???)
-АВАНГАРДНЫЙ (ушло в ст. "авангард")
!АВАНЗАЛА>АВАНЗАЛ
+АВАНГАРДИЗМ
+АВАНГАРДИСТ
+АВАНПОРТ
-АВАНПОСТНЫЙ (ушло в ст. "аванпост")
-АВАНСИРОВАТЬСЯ (хотя осталось "авансировать")
-АВАНСОВЫЙ (ушло в ст. "аванс")
-АВАНТАЖ
-АВАНТАЖНЫЙ
-АВАНТЮРИСТКА (ушло в ст. "авантюрист")
!АВАНТЮРИСТСКИЙ>АВАНТЮРИСТИЧНЫЙ
+АВАРИЙНОСТЬ
+АВАРИЙНЫЙ (у Ушакова было "безаварийно" в примере к ст. "налетать", у Ожегова исчезло)
+АВАРИЙЩИК
-АВАРКА (ушло в ст. "аварцы")
!АВГИЕВЫ>АВГИЕВ
-АВГУР
-АВГУСТЕЙШИЙ (!!!)
-АВГУСТОВСКИЙ (ушло в ст. "август")
-АВИАМАТКА
+АВИАМОДЕЛИЗМ
+АВИАМОДЕЛИСТ
+АВИАМОДЕЛЬ
-АВИАТИКА
+АВИАНОСНЫЙ ("авианосец" было и осталось)
!АЭРОПОЧТА>АВИАПОЧТА
+АВИАСАЛОН
-АВИАТОРСКИЙ (ушло в ст. "авиатор")
-АВИАЦИОННЫЙ (ушло в ст. "авиация")
-АВИЕТКА
*АВИА/авио>АВИА
+АВИЗО
+АВИТАМИНОЗ
+АВОСЬКА
-АВРАЛЬНЫЙ (ушло в ст. "аврал")
-АВРОРА
-АВСТРИЙКА (ушло в ст. "австрийцы")
+АВСТРАЛИЙСКИЙ (у Ушакова было в толкованиях с Б)
+АВСТРАЛИЙЦЫ
+АВСТРАЛОИДНЫЙ
-АВСТРИЯК
-АВСТРИЯЧКА
+АВСТРОАЗИАТСКИЙ
+АВСТРОНЕЗИЙСКИЙ
!АВТЕНТИЧЕСКИЙ/АВТЕНТИЧНЫЙ>АУТЕНТИЧНЫЙ
-АВТОБИОГРАФИЧНОСТЬ (ушло в ст. "автобиографичный")
+АВТОБЛОКИРОВКА
-АВТОБУСНЫЙ (ушло в ст. "автобус")
+АВТОВОКЗАЛ
+АВТОГЕН
!АВТОЖИР/АВТОГИР/ВЕРТОЛЁТ>ВЕРТОЛЁТ
-АВТОГРАФИЧЕСКИЙ (ушло в ст. "автограф")
!САМОУЧКА/АВТОДИДАКТ>САМОУЧКА
-АВТОКРАТ
-АВТОКРАТИЧЕСКИЙ
-АВТОКРАТИЯ (!!!)
+АВТОГУЖЕВОЙ
+АВТОДОРОЖНЫЙ
+АВТОЗАВОД
+АВТОКАР
+АВТОКЛАВ
-АВТОМАТИЗАЦИЯ (ушло в ст. "автоматизировать")
+АВТОМАТИКА (!!!)
+АВТОМАТЧИК (у Ушакова не было "автомат" в значении оружия)
+АВТОМАШИНА (у Ушакова было в толкованиях с М)
-АВТОМОБИЛИСТКА (ушло в ст. "автомобилист")
-АВТОМОБИЛЬНЫЙ (ушло в ст. "автомобиль")
-АВТОНОМИСТ (хотя осталось "автономия")
+АВТОМОДЕЛИЗМ
+АВТОМОДЕЛИСТ
+АВТОМОДЕЛЬ
+АВТОМОТРИСА
+АВТОПИЛОТ
+АВТОПОГРУЗЧИК
+АВТОПОИЛКА
-АВТОРИЗАЦИЯ (!!!)
-АВТОРИЗОВАННЫЙ
+АВТОРЕФЕРАТ (!!!)
-АВТОРИЗОВАТЬСЯ
+АВТОРИТАРИЗМ ("авторитарный" было и осталось)
-АВТОРИТЕТНОСТЬ (ушло в ст. "авторитетный")
-АВТОРСКИЙ (ушло в ст. "автор")
-АВТОСАНИ
-АВТОСАННЫЙ
-АВТОСМЕСЬ
-АВТОТИПИЧЕСКИЙ
-АВТОТИПИЯ
+АВТОРУЧКА
+АВТОСАЛОН
+АВТОСЕРВИС
+АВТОСТОП
+АВТОСТРАДА
+АВТОСЦЕПКА
+АВТОТРАКТОРНЫЙ
+АВТОТРАНСПОРТ
!АВТОХТОНЫ/АУТОХТОНЫ>АВТОХТОНЫ
+АВТОХТОННЫЙ ("автохтоны" было и осталось)
+АВТОЦИСТЕРНА
-АГАВА
-АГАТОВЫЙ (ушло в ст. "агат")
-АГЕНТСКИЙ (ушло в ст. "агент")
-АГЕНТУРНЫЙ (ушло в ст. "агентура")
-АГЕНТША (!!! у слова "агент" вообще не дана женская форма)
-АГИТАТОРСКИЙ (ушло в ст. "агитатор")
-АГИТАЦИОННЫЙ (ушло в ст. "агитация")
-АГИТПРОП
+АГИТПУНКТ (было в примерах к ст. "агит")
-АГЛОМЕРАТ/АГГЛОМЕРАТ/АГЛОМЕРИТ/АГГЛОМЕРИТ (!!!)
+АГНОСТИК (у Ушакова было в примерах с О)
+АГНОСТИЦИЗМ
-АГОРАФОБИЯ
-АГРАМАНТ
-АГРАРНИК (хотя осталось "аграрий")
-АГРАФ
-АГРЕССИВНОСТЬ (ушло в ст. "агрессивный")
-АГРИКУЛЬТУРНЫЙ
-АГРОМАКСИМУМ
-АГРОМИНИМУМ
+АГРОКУЛЬТУРА
-АГРОНОМИЧЕСКИЙ (ушло в ст. "агрономия")
+АГРОПРОМЫШЛЕННЫЙ
+АГРОТЕХНИК
+АГРОТЕХНИКА (у Ушакова было "агротехнический" в толковании ст. "свеклоутомление")
+АГРОХИМИК
+АГРОХИМИЯ
-АГУШЕНЬКИ (хотя осталось "агу")
-АДАМ (хотя осталось в толкованиях)
-АДАМАНТ
-АДАМАНТОВЫЙ
+АДАПТАЦИЯ (!!!)
+АДАПТИТОВАТЬ (!!!)
+АДВЕНТИСТ
-АДВОКАТСКИЙ (ушло в ст. "адвокат")
-АДВОКАТСТВОВАТЬ
!АДЕНОИД>АДЕНОИДЫ
*АДЭКВАТНЫЙ>АДЕКВАТНЫЙ
!ЧЕРКЕСЫ/АДЕХ>ЧЕРКЕСЫ
-АДМИНИСТРАТИВНЫЙ (ушло в ст. "администрация")
+АДЖАРСКИЙ
+АДЖАРЦЫ
-АДМИНИСТРАТОРСКИЙ (ушло в ст. "администратор")
-АДМИНИСТРИРОВАНИЕ (ушло в ст. "администрировать")
-АДМИРАЛТЕЙСКИЙ (ушло в ст. "адмиралтейство")
-АДМИРАЛЬСКИЙ (ушло в ст. "адмирал")
-АДМИРАЛЬША
!АДРЕСАНТ/ОТПРАВИТЕЛЬ>ОТПРАВИТЕЛЬ
-АДРЕСНЫЙ (ушло в ст. "адрес")
-АДРЕСОВАННЫЙ (ушло в ст. "адресовать")
-АДСКИ (ушло в ст. "адский")
+АДЪЮНКТУРА
-АДЪЮТАНТСКИЙ (ушло в ст. "адъютант")
-АДЮЛЬТЕР (!!!)
-АДЮЛЬТЕРНЫЙ
-АЖИО/ЛАЖ
+АДЫГЕЙСКИЙ (у Ушакова было в толкованиях с А)
+АДЫГЕЙЦЫ (у Ушакова было в толковании к ст. "черкесы")
+АДЫГИ
+АЖ/АЖНО (???)
-АЗАРТНИЧАТЬ
-АЗБЕСТ/АСБЕСТ>АСБЕСТ
-АЗБЕСТОВЫЙ/АСБЕСТОВЫЙ>асбестовый (в ст. "асбест")
-АЗБУЧКА
-АЗБУЧНЫЙ (ушло в ст. "азбука")
-АЗЕФОВЩИНА
!АЗИАТ>АЗИАТЫ
-АЗИАТКА (ушло в ст. "азиаты")
+АЗБУКА (??? было "азбучка", "азбучный")
+АЗЕРБАЙДЖАНСКИЙ (у Ушакова было в толкованиях с Т)
+АЗЕРБАЙДЖАНЦЫ (у Ушакова было в толкованиях с Т)
-АЗИАТЧИНА
-АЗИЙСКИЙ
+АЗИМУТ
-АЗОТИСТЫЙ
-АЗЯМ
-АИ
-АИР
+АЗУ
+АИСТЁНОК
+АИСТИХА
+АЙБОЛИТ
-АЙРАН
-ак
-академ
-АКАДЕМИСТ
-АКАНТ
-АКАНЬЕ (ушло в ст. "акать")
-АКАЮЩИЙ (ушло в ст. "акать")
+АКВА
+АКВАЛАНГ
+АКВАЛАНГИСТ
!АКВАМАРИННЫЙ/АКВАМАРИНОВЫЙ>АКВАМАРИНОВЫЙ
+АКВАНАВТ
+АКВАПАРК
-АКВАРЕЛИСТКА (ушло в ст. "акварелист")
-АКВАРЕЛЬНЫЙ (ушло в ст. "акварель")
!АКВАРИЙ/АКВАРИУМ>АКВАРИУМ
+АКВАТОРИЯ (!!!)
-АКВИЛОН
*АКЛИМАТИЗИРОВАТЬ/АККЛИМАТИЗИРОВАТЬ>АККЛИМАТИЗИРОВАТЬ
*АКЛИМАТИЗИРОВАТЬСЯ/АККЛИМАТИЗИРОВАТЬСЯ>АККЛИМАТИЗИРОВАТЬСЯ
*АКОМОДАЦИЯ/АККОМОДАЦИЯ>АККОМОДАЦИЯ
*АКОМОДАЦИОННЫЙ/АККОМОДАЦИОННЫЙ>аккомодационный (в ст. "аккомодация")
*АКОМПАНЕМЕНТ/АККОМПАНЕМЕНТ>АККОМПАНЕМЕНТ
*АКОМПАНИАТОР/АККОМПАНИАТОР>АККОМПАНИАТОР
*АКОМПАНИАТОРША/АККОМПАНИАТОРША>аккомпаниаторша (в ст. "аккомпаниатор")
*АКОМПАНИРОВАТЬАККОМПАНИРОВАТЬ/>АККОМПАНИРОВАТЬ
*АКОРД/АККОРД>АККОРД
*АКОРДНЫЙ/АККОРДНЫЙ>АККОРДНЫЙ
+АККОРДЕОН (!!!)
+АККОРДЕОНИСТ
*АКРЕДИТИВ/АККРЕДИТИВ>АККРЕДИТИВ
*АКРЕДИТИВНЫЙ/АККРЕДИТИВНЫЙ>аккредитивный (в ст. "аккредитив")
*АКРЕДИТОВАННЫЙ/АККРЕДИТОВАННЫЙ>аккредитованный (в ст. "аккредитовать")
-АКРЕДИТОВАТЬСЯ/АККРЕДИТОВАТЬСЯ (хотя осталось "аккредитовать")
*АКРЕДИТОВАТЬ/АККРЕДИТОВАТЬ>АККРЕДИТОВАТЬ
-АККУМУЛЯТОРНЫЙ (ушло в ст. "аккумулятор")
*АКЛИМАТИЗАЦИОННЫЙ/АККЛИМАТИЗАЦИОННЫЙ>акклиматизационный (в ст. "акклиматизировать")
*АКЛИМАТИЗАЦИЯ/АККЛИМАТИЗАЦИЯ>акклиматизация (в ст. "акклиматизировать")
*АКУРАТ>АККУРАТ
+АККУРАТИСТ
*АКУРАТНЫЙ/АККУРАТНЫЙ>АККУРАТНЫЙ
*АКУРАТНО/АККУРАТНО>аккуратно (в ст. "аккуратный")
*АКУРАТНОСТЬ/АККУРАТНОСТЬ>аккуратность (в ст. "аккуратный")
-АКМЕИСТКА (ушло в ст. "акмеист")
-АКМЕИСТСКИЙ (хотя осталось "акмеист")
-АКОНИТ
!АКРОБАТИЧЕСКИЙ/АКРОБАТИЧНЫЙ>акробатический (ушло в ст. "акробатика")
!АКРОБАТИЧНОСТЬ/АКРОБАТИЗМ>АКРОБАТИЗМ
-АКРОБАТКА (ушло в ст. "акробат")
-АКРОБАТНИЧАТЬ
-АКСАМИТ
+АКСЕЛЕРАТ
+АКСЕЛЕРАЦИЯ
*АКСЕСУАР/АКСЕССУАР>АКСЕССУАР
+АКСИОМАТИЧНЫЙ (хотя осталось и "аксиоматический")
-АКТЕАТР
!АКТРИСА/АКТЁРКА>АКТРИСА
-АКТЁРСКИЙ (ушло в ст. "актёр")
-АКТИВИЗАЦИЯ (ушло в ст. "активизировать")
-АКТИВИЗМ (хотя осталось "активист")
-АКТИВИСТКА (ушло в ст. "активист")
-АКТИВИСТСКИЙ (ушло в ст. "активист")
-АКТИВНОСТЬ (ушло в ст. "активный")
+АКТИВНИЧАТЬ
-актный (хотя осталось "одноактный" в ст. "одно" и "трёхактный" в ст. "трёх")
-АКТОВЫЙ (ушло в ст. "акт")
+АКТИРОВАТЬ
-АКТУАЛЬНОСТЬ (ушло в ст. "актуальный")
-АКУЛИЙ (ушло в ст. "акула")
+АКУСТИК
-АКУСТИЧЕСКИЙ (ушло в ст. "акустика")
-АКУШЕРСКИЙ (ушло в ст. "акушер/акушёр")
-АКЦЕПТ
-АКЦЕПТОВАННЫЙ
-АКЦЕПТОВАТЬ
-АКЦЕПТОВАТЬСЯ
-АКЦИЗНИК (хотя осталось "акцизный" в ст. "акциз")
-АКЦИЗНЫЙ (ушло в ст. "акциз")
+АКЦЕНТИРОВАТЬ
+АКЦЕНТОЛОГИЯ
-АКЦИОНЕРНЫЙ (ушло в ст. "акция")
-АКЦИОНЕРСКИЙ (ушло в ст. "акционер")
-АЛАРМИСТ
-АЛАРМИСТСКИЙ
+АКЫН
+АЛБАНСКИЙ
!АРНАУТКА>АЛБАНЦЫ
-АЛГЕБРАИСТ
-АЛГЕБРАИЧЕСКИЙ (ушло в ст. "алгебра")
+АЛГОРИТМ
-АЛЕКСАНДРИЙСКИЙ
+АЛЕТЬСЯ (хотя было "заалеться", у Ожегова исчезло)
+АЛЕУТСКИЙ (хотя было "алеуты" в толковании к ст. "индейцы")
+АЛЕУТЫ (было в толковании к ст. "индейцы")
+АЛЖИРСКИЙ (у Ушакова было в толкованиях с З)
+АЛЖИРЦЫ (у Ушакова было "туземцы-алжирцы" в ст. "тюркос")
-АЛИЗАРИНОВЫЙ (ушло в ст. "ализарин")
-АЛИМЕНТНЫЙ (ушло в ст. "алименты")
-АЛИМЕНТЩИЦА (!!! хотя осталось "алиментщик")
+АЛКАЛОИДЫ (у Ушакова было в толкованиях с К)
+АЛКАШ (!!!)
-АЛКОГОЛИЧЕСКИЙ (ушло в ст. "алкоголизм")
-АЛКОГОЛЬНЫЙ (ушло в ст. "алкоголь")
!КОРАН/АЛКОРАН>КОРАН
-АЛЛЕГРИ
+АЛЛЕРГЕН
+АЛЛЕРГИК
+АЛЛЕРГИЯ (!!!)
+АЛЛЕРГО
-АЛЛИТЕРАЦИЯ (!!!)
*АЛИГАТОР/АЛЛИГАТОР>АЛЛИГАТОР
+АЛЛИЛУЙЯ (было "аллилуия" в ст. "алилуйщик/аллилуйщик" и "аллилуйя" в примерах с Л)
-АЛИЛУЙНЫЙ/АЛЛИЛУЙНЫЙ (хотя осталось "аллилуйя")
-АЛИЛУЙЩИК/АЛЛИЛУЙЩИК (хотя осталось "аллилуйя")
-АЛИЛУЙЩИНА/АЛЛИЛУЙЩИНА (хотя осталось "аллилуйя")
-АЛЛОПАТИЧЕСКИЙ (ушло в ст. "аллопатия")
*АЛЛО/АЛО>АЛЛО
-АЛОГИЗМ (!!! "нелогичность" нет и не было)
-АЛОГИЧЕСКИЙ/АЛОГИЧНЫЙ (!!! хотя "нелогичный" осталось в толкованиях)
По словарю Ожегова это первые 370 слов, по словарю Ушакова - первые 451.
Это при том, что 74 слова ушли внутрь статей, так что размер словника практически не изменился!
Орфография изменилась в 28 словах (в том числе бывшие варианты).
Добавлено 119 слов.
Выброшено 102 слова.
Даже боюсь экстраполировать эти цифры на весь словарь!
Цитата: Hellerick от августа 14, 2012, 10:42
Составил список пар слов, которые стоят рядом по алфавиту, находятся в разных словарях, и имеют между собой расстояние Левенштейна равное единице.
Понравилась пара "вздрогнуть=вздротнуть"...
Цитата: Alone Coder от августа 13, 2012, 08:50
Подкиньте программку под Windows XP, которая сравнит два отсортированных текстовых файла
Вообще, Кодер, вы меня удивляете. Кто тут, собственно, Кодер?.. Задача же элементарно алгоритмизуется и реализуется программно, коль скоро слова в файлах уже отсортированы по алфавиту...
Не все кодеры одинаково полезны! ;D
На самом деле задачка нетривиальная. Корень зла в требовании -Б. Получается, что это и не пересечение множеств и не их разность. Так что "в лоб" не решается. Вероятнее всего, Хеллерик нашел здесь единственно правильный подход, применив приблизительный поиск...
С удовольствием ознакомлюсь с вашим вариантом. Дайте набросок алгоритма в псевдокоде.
Цитата: Rachtyrgin от августа 16, 2012, 17:11
На самом деле задачка нетривиальная. Корень зла в требовании -Б. Получается, что это и не пересечение множеств и не их разность. Так что "в лоб" не решается.
Боже ж ты мой... :fp:
-Пишем блок, который определяет, идет слово b ДО слова a по алфавиту или после.
-Начинаем параллельное движение по двум файлам. Начинаем, ес-но, с 1-го слова 1-го файла. Начинаем сравнивать со словами 2-го файла с помощью нашего блока. Если слово b идет до слова a, пишем его в целевой файл как +b, переходим к следующему слову 2-го файла. Если слово b совпадает со словом a, переходим к следующему слову 1-го файла и следующему слову 2-го файла. Если слово b идет после слова a, пишем слово а в целевой файл как -а, переходим к следующему слову 1-го файла.
ВСЁ.
P.S.: Ну вы поняли, что сначала оптимальнее определять, совпадает ли пара слов, а уж если не совпадает, тогда мучить их нашим блоком. Это мелочи.
А как вы обеспечите синхронность итерации по файлу Ушаков и файлу Ожегов? Количество слов, соответственно, строк в них все-таки разное. И еще, пожалуйста, уточните, в какие сущности вы предполагаете считывать файлы - Set, List, Array?
Цитата: Rachtyrgin от августа 16, 2012, 19:01в какие сущности вы предполагаете считывать файлы - Set, List, Array?
Сущность File чем не мила? :what:
Цитата: Rachtyrgin от августа 16, 2012, 19:01
А как вы обеспечите синхронность итерации по файлу Ушаков и файлу Ожегов? Количество слов, соответственно, строк в них все-таки разное.
А зачем оно должно быть одинаковое? :??? Я теряю нить вашей мысли. Еще раз: x - позиция (номер строки) в 1-м файле, y - позиция во 2-м файле, алгоритм обеспечивает параллельное сравнение при минимуме операций. И он почти повторяет то, как вы это сами делали бы ИРЛ.
Для конца файла еще добавьте: при невозможности перейти к следующему a, записываем оставшиеся b как +b (если есть) и завершаем. При невозможности перейти к следующему b, записываем оставшиеся a как -a (если есть) соответственно.
Цитата: Bhudh от августа 16, 2012, 19:10
Сущность File чем не мила? :what:
Я все сущности люблю. Кроме, разве что, массивов. Вопрос только в том, что можно делать с сущностью file? Открыть, прочитать, записать, закрыть?
Так а и зачем нужно сохранять (сиречь дублировать) весь файл, если он уже в зубах? Для сравнения две переменных всего нужно :donno:.
Rachtyrgin, ну что же вы?
Файлы можно открыть и читать построчно. Массивы и другие подобные вещи нам вообще не нужны. Просто читаем очередную строку из того файла, в котором последняя строка была меньше, и сравниваем последние строки обоих файлов. И так пока не прочитаем всё.
Вот на C#:
using(var file1 = new StreamReader(args[0], true))
using(var file2 = new StreamReader(args[1], true))
{
string s1 = file1.ReadLine();
string s2 = file2.ReadLine();
while(s1 != null || s2 != null)
{
if(s2 == null || s1.CompareTo(s2) < 0)
{
Console.WriteLine("- {0}", s1);
s1 = file1.ReadLine();
}
else if(s1 == null || s2.CompareTo(s1) < 0)
{
Console.WriteLine("+ {0}", s2);
s2 = file2.ReadLine();
}
else
{
s1 = file1.ReadLine();
s2 = file2.ReadLine();
}
}
}
Может, можно как-то и покрасивше написать, я не старался.
О, но ведь это ответ на мой вопрос о сущностях! Я действительно забыл упомянуть о Stringах. Я, правда, программирую на яве, но ваш синтаксис мне, в принципе, понятен. За исключением одной детали - все-таки на консоль (в вашем случае) будут выведены слова из файла Ушаков, которых нет в файле Ожегов? Кодер нам это запретил...
Никто не мешает поставить ifʼы как на плюсы, так и на минусы, чтобы выводить по заказу.
Можно и чекбоксов навтыкать.
Цитата: Rachtyrgin от августа 16, 2012, 19:01
И еще, пожалуйста, уточните, в какие сущности вы предполагаете считывать файлы - Set, List, Array?
Ленивые последовательности для такой задачи идеально подойдут, ІМНО.
Ща попробую сформулировать на кложуре.
Наконец пришел Питон. Щас он нас разрулит...
(use 'clojure.java.io)
(defn join-sorted [f1 f2]
(lazy-seq
(let[w1 (or (first f1) ["" ""])
w2 (or (first f2) ["" ""])
cmpres (compare (w1 1) (w2 1))]
(cond (= "" (w1 1) (w2 1)) nil
(= (w2 1) "") f1
(= (w1 1) "") f2
(= cmpres 0) (join-sorted (rest f1) (rest f2))
(< cmpres 0) (cons w1 (join-sorted (rest f1) f2))
(> cmpres 0) (cons w2 (join-sorted f1 (rest f2)))
))))
(->> (join-sorted
(->>(reader "ozhegov.txt")
line-seq
(map #(vector "+" %)))
(->>(reader "ushakov.txt")
line-seq
(map #(vector "-" %)))
(map #(println (% 0) (% 1)))
dorun)
Программа для Clojure.
Данные берутся из ozhegov.txt и ushakov.txt, результат — через стандартный вывод. Входные файлы должны содержать отсортированные списки слов без повторов.
Ну что ж, это то, о чем я говорил. Входные файлы должны быть пропущены через Set. А язык ваш хорош...
ЦитироватьВходные файлы должны быть пропущены через Set.
Есть утилитка uniq, убирающая повторы соседних строк. Либо можно в той же программе на кложуре добавить удаление одинаковых соседних элементов в каждой последовательности:
(->> (reader "ozhegov.txt")
line-seq
(reductions #(if (not= %1 %2) %2) nil)
(filter #(do %)) (map #(vector "+" %)))
и аналогично с ушаковым
Еще возможны проблемы с сортировкой из-за буквы ё, если она используется в словарях. Если сравнивать по юникодовским кодам (а программа будет использовать именно их), Ё идет вообще после Я (или перед а, если брать строчную ё) — список слов должен быть отсортирован соответствующим образом, иначе мы получим неправильный результат из-за разного порядка сортировки. В словаре же она, скорее всего, будет приравнена к Е (но в самой программе такой способ сравнения использовать нельзя: так она ошибочно примет за одинаковые слова ВСЕ и ВСЁ и под., что может испортить результат).
Цитата: Python от августа 16, 2012, 22:07
Либо можно в той же программе на кложуре добавить удаление одинаковых соседних элементов в каждой последовательности:
(->> (reader "ozhegov.txt")
line-seq
(reductions #(if (not= %1 %2) %2) nil)
(filter #(do %))
(map #(vector "+" %)))
и аналогично с ушаковым
Это будет работать с удвоением строк, но на нечетных количествах (3, 5 и т.д.) будут повторы. Исправляюсь:
(->> (reader "ozhegov.txt")
line-seq
(reductions #(if (or (not= %1 %2) (= [] %1)) [%2]) [])
(apply concat) (map #(vector "+" %)))
Извиняюсь, но снова не то. Еще исправление:
(->> (reader "ozhegov.txt")
line-seq
(reductions #(if (and (not= %1 %2) (not= %1 nil)) [%2]))
(apply concat)
(map #(vector "+" %)))
Буква А:
У Ушакова это первые 1269 статей из 88366 (1.4%).
У Ожегова это первые 916 статей из 41111 (2.2%).
237 + 11 (изменивших написание) + 13 (заменённых) слов ушли внутрь статей + 3 только в толкования и примеры.
Наоборот, из статей вышло 22 новых слова.
Кроме того, добавлено 213 + 9 (на замену старых) слов.
Убрано 266 + 9 (заменены на новые) слов.
Написание изменили:
на новое:
*АББАТИССА>АББАТИСА
*АДЭКВАТНЫЙ>АДЕКВАТНЫЙ
*АКУРАТ>АККУРАТ
*АНАРХОСИНДИКАЛИЗМ>АНАРХО-СИНДИКАЛИЗМ
на основной вариант:
*АВИА/авио>АВИА
*АЛЛО/АЛО>АЛЛО
*ОРАВА/АРАВА>ОРАВА
*АРЬЕРГАРД/АРИЕРГАРД>АРЬЕРГАРД
на неосновной вариант:
*АБЕРАЦИЯ/АБЕРРАЦИЯ>АБЕРРАЦИЯ
*АБРЕВИАТУРА/АБРЕВИАЦИЯ>АББРЕВИАТУРА
*АЗБЕСТ/АСБЕСТ>АСБЕСТ
*АЗБЕСТОВЫЙ/АСБЕСТОВЫЙ>асбестовый (в ст. "асбест")
*АКЛИМАТИЗИРОВАТЬ/АККЛИМАТИЗИРОВАТЬ>АККЛИМАТИЗИРОВАТЬ
*АКЛИМАТИЗИРОВАТЬСЯ/АККЛИМАТИЗИРОВАТЬСЯ>АККЛИМАТИЗИРОВАТЬСЯ
*АКОМОДАЦИЯ/АККОМОДАЦИЯ>АККОМОДАЦИЯ
*АКОМОДАЦИОННЫЙ/АККОМОДАЦИОННЫЙ>аккомодационный (в ст. "аккомодация")
*АКОМПАНЕМЕНТ/АККОМПАНЕМЕНТ>АККОМПАНЕМЕНТ
*АКОМПАНИАТОР/АККОМПАНИАТОР>АККОМПАНИАТОР
*АКОМПАНИАТОРША/АККОМПАНИАТОРША>аккомпаниаторша (в ст. "аккомпаниатор")
*АКОМПАНИРОВАТЬ/АККОМПАНИРОВАТЬ>АККОМПАНИРОВАТЬ
*АКОРД/АККОРД>АККОРД
*АКОРДНЫЙ/АККОРДНЫЙ>АККОРДНЫЙ
*АКРЕДИТИВ/АККРЕДИТИВ>АККРЕДИТИВ
*АКРЕДИТИВНЫЙ/АККРЕДИТИВНЫЙ>аккредитивный (в ст. "аккредитив")
*АКРЕДИТОВАННЫЙ/АККРЕДИТОВАННЫЙ>аккредитованный (в ст. "аккредитовать")
*АКРЕДИТОВАТЬ/АККРЕДИТОВАТЬ>АККРЕДИТОВАТЬ
*АКЛИМАТИЗАЦИОННЫЙ/АККЛИМАТИЗАЦИОННЫЙ>акклиматизационный (в ст. "акклиматизировать")
*АКЛИМАТИЗАЦИЯ/АККЛИМАТИЗАЦИЯ>акклиматизация (в ст. "акклиматизировать")
*АКУРАТНЫЙ/АККУРАТНЫЙ>АККУРАТНЫЙ
*АКУРАТНО/АККУРАТНО>аккуратно (в ст. "аккуратный")
*АКУРАТНОСТЬ/АККУРАТНОСТЬ>аккуратность (в ст. "аккуратный")
*АКСЕСУАР/АКСЕССУАР>АКСЕССУАР
*АЛИГАТОР/АЛЛИГАТОР>АЛЛИГАТОР
*АПАРАТ/АППАРАТ>АППАРАТ
*АПАРАТУРА/АППАРАТУРА>АППАРАТУРА
*АПАРАТЧИК/АППАРАТЧИК>АППАРАТЧИК
*АПЕНДИКС/АППЕНДИКС>АППЕНДИКС
*АПЕНДИЦИТ/АППЕНДИЦИТ>АППЕНДИЦИТ
*АПЕРЦЕПЦИЯ/АППЕРЦЕПЦИЯ>АППЕРЦЕПЦИЯ
*АПЕТИТ/АППЕТИТ>АППЕТИТ
*АПЕТИТНЫЙ/АППЕТИТНЫЙ>АППЕТИТНЫЙ
*АПЛИКАЦИЯ/АППЛИКАЦИЯ>АППЛИКАЦИЯ
*АСИГНАЦИЯ/АССИГНАЦИЯ>АССИГНАЦИЯ
*АСИГНОВАННЫЙ/АССИГНОВАННЫЙ>ассигнованный (в ст. "ассигновать")
*АСИГНОВАТЬ/АССИГНОВАТЬ>АССИГНОВАТЬ
*АСАМБЛЕЯ/АССАМБЛЕЯ>АССАМБЛЕЯ
*АСЕНИЗАЦИОННЫЙ/АССЕНИЗАЦИОННЫЙ>ассенизационный (в ст. "ассенизация")
*АСЕНИЗАТОР/АССЕНИЗАТОР>АССЕНИЗАТОР
*АСЕНИЗАЦИЯ/АССЕНИЗАЦИЯ>АССЕНИЗАЦИЯ
*АСОРТИМЕНТ/АССОРТИМЕНТ>АССОРТИМЕНТ
*АТЕСТАТ/АТТЕСТАТ>АТТЕСТАТ
*АТЕСТОВАТЬ/АТТЕСТОВАТЬ>АТТЕСТОВАТЬ
*АТРАКЦИОН>АТТРАКЦИОН
*АФЕКТ/АФФЕКТ>АФФЕКТ
*АФЕКТАЦИЯ/АФФЕКТАЦИЯ>АФФЕКТАЦИЯ
*АФЕКТИРОВАННЫЙ/АФФЕКТИРОВАННЫЙ>АФФЕКТИРОВАННЫЙ
Заменены слова:
на новые:
!АБОНЕНТНЫЙ>абонентский (в ст. "абонент")
!АВАНЗАЛА>АВАНЗАЛ
!АВАНТЮРИСТСКИЙ>АВАНТЮРИСТИЧНЫЙ
!АЭРОПОЧТА>АВИАПОЧТА
!АВТЕНТИЧЕСКИЙ/АВТЕНТИЧНЫЙ>АУТЕНТИЧНЫЙ
!АРНАУТКА>АЛБАНЦЫ
!АМИКОШОНСТВО>беспардонность (в ст. "беспардонный")
!АМОРАЛИЗМ>АМОРАЛКА
!ГАЛЬВАНОМЕТР>АМПЕРМЕТР (гальванометр осталось в ст. "гальвано")
на старые:
!АНОРМАЛЬНЫЙ>аномальный (в ст. "аномалия" значение не указано, но у Ушакова в "анормальный" пример на совр. значение слова "аномальный", которого раньше не было)
!АНТИК>АНТИКВАРИАТ (изменено значение слова "антиквариат")
изменён основной вариант:
!АВИАМАТКА/АВИАНОСЕЦ>АВИАНОСЕЦ
!АВТОЖИР/АВТОГИР/ВЕРТОЛЁТ>ВЕРТОЛЁТ
!АДРЕСАНТ/ОТПРАВИТЕЛЬ>ОТПРАВИТЕЛЬ
!АКВАМАРИННЫЙ/АКВАМАРИНОВЫЙ>АКВАМАРИНОВЫЙ
!АКВАРИЙ/АКВАРИУМ>АКВАРИУМ
!АКРОБАТИЧНОСТЬ/АКРОБАТИЗМ>АКРОБАТИЗМ
!АНТИМОНИЙ/АНТИМОНИЯ>АНТИМОНИЯ
!АНТИСЕМИТИЧЕСКИЙ/АНТИСЕМИТСКИЙ>антисемитский (в ст. "антисемит" и "антисемитизм")
!АРАБЕСК/АРАБЕСКА>АРАБЕСКА
!АРИТМИЧНОСТЬ/АРИТМИЯ>АРИТМИЯ - NB р вместо рр
!АРМЯЧНЫЙ/АРМЯЖНЫЙ>армячный (в ст. "армяк")
!АЭРОЛИТ/МЕТЕОРИТ/МЕТЕОРОЛИТ>МЕТЕОРИТ
убраны неосновные варианты:
!ЧЕРКЕСЫ/АДЕХ>ЧЕРКЕСЫ
!САМОУЧКА/АВТОДИДАКТ>САМОУЧКА
!АВТОХТОНЫ/АУТОХТОНЫ>АВТОХТОНЫ
!АКРОБАТИЧЕСКИЙ/АКРОБАТИЧНЫЙ>акробатический (в ст. "акробатика")
!АКТРИСА/АКТЁРКА>АКТРИСА
!КОРАН/АЛКОРАН>КОРАН
!АЛОЭ/АЛОЙ>АЛОЭ
!БЕЛОК/АЛЬБУМИН>БЕЛОК
!ЗАЛОЖНИК/АМАНАТ>ЗАЛОЖНИК
!ЛЮБИТЕЛЬ/АМАТЁР>ЛЮБИТЕЛЬ
!ЛЮБИТЕЛЬНИЦА/АМАТЁРКА>любительница (в ст. "любитель")
!ЭМБАРГО/АМБАРГО>ЭМБАРГО
!АМБРОЗИЯ/АМВРОЗИЯ>АМБРОЗИЯ
!БЕСПАРДОННЫЙ/АМИКОШОНСКИЙ>БЕСПАРДОННЫЙ
!АММИАК/АММОНИАК>АММИАК
!АНТИКВАР/АНТИКВАРИЙ>АНТИКВАР
!АНТИНОМИЧЕСКИЙ/АНТИНОМИЧНЫЙ>антиномический (в ст. "антиномия")
!ПРЕДВОСХИЩЕНИЕ/АНТИЦИПАЦИЯ>предвосхищение (в ст. "предвосхитить")
!ПРЕДВОСХИТИТЬ/АНТИЦИПИРОВАТЬ>ПРЕДВОСХИТИТЬ
!ЧЕЛОВЕКООБРАЗНЫЙ/АНТРОПОМОРФНЫЙ>ЧЕЛОВЕКООБРАЗНЫЙ
!ЛЮДОЕД/КАННИБАЛ/АНТРОПОФАГ>ЛЮДОЕД/КАННИБАЛ
!ЛЮДОЕДСТВО/КАННИБАЛИЗМ/АНТРОПОФАГИЯ>ЛЮДОЕДСТВО
!АНТРАША/АНТРША>АНТРАША
!БАСНЯ/БАСНЬ/АПОЛОГ>БАСНЯ
!БАСЕННЫЙ/АПОЛОГИЧЕСКИЙ>БАСЕННЫЙ
!АПОПЛЕКСИЧЕСКИЙ/АПОПЛЕКТИЧЕСКИЙ>АПОПЛЕКСИЧЕСКИЙ (в ст. "апоплексия")
!АПРИОРНЫЙ/АПРИОРИСТИЧЕСКИЙ>АПРИОРНЫЙ
!АСИГНОВАНИЕ/АССИГНОВАНИЕ/АСИГНОВКА/АССИГНОВКА>ассигнование (в ст. "ассигновать")
!УДУШЬЕ/АСФИКСИЯ>УДУШЬЕ
!ОТАРА/АТАРА>ОТАРА
!АТЛАСНЫЙ/АТЛАСИСТЫЙ>АТЛАСНЫЙ (в ст. "атлас")
!АУТОДАФЕ/АВТОДАФЕ>АУТОДАФЕ
изменено название гнезда:
!АВГИЕВЫ>АВГИЕВ
!АДЕНОИД>АДЕНОИДЫ
!АЗИАТ>АЗИАТЫ
!АМЕРИКАНЕЦ>АМЕРИКАНЦЫ
!АМУР>АМУРЫ
!АННИБАЛОВА>АННИБАЛОВ
!АНТИЛОПА>АНТИЛОПЫ
!АНЮТИНЫ>АНЮТИН
!АПАРТАМЕНТ>АПАРТАМЕНТЫ
!АРИАДНИНА>АРИАДНИН
Новые слова:
взяты из примеров и толкований (22):
+АБИССИНЦЫ (у Ушакова было в толковании ст. "эфиоп")
+АБХАЗСКИЙ (у Ушакова было в примере к ст. "гибрид" и в толковании к ст. "лазы")
+АВСТРАЛИЙСКИЙ (у Ушакова было в толкованиях с Б)
+АВТОМАШИНА (у Ушакова было в толкованиях с М)
+АГИТПУНКТ (у Ушакова было в примерах к ст. "агит")
+АГНОСТИК (у Ушакова было в примерах с О)
+АДЫГЕЙСКИЙ (у Ушакова было в толкованиях с А)
+АДЫГЕЙЦЫ (у Ушакова было в толковании к ст. "черкесы")
+АЗБУКА (??? было "азбучка", "азбучный", а "азбука" только в толкованиях с А)
+АЗЕРБАЙДЖАНСКИЙ (у Ушакова было в толкованиях с Т)
+АЗЕРБАЙДЖАНЦЫ (у Ушакова было в толкованиях с Т)
+АЛЕУТЫ (было в толковании к ст. "индейцы")
+АЛЖИРСКИЙ (у Ушакова было в толкованиях с З)
+АЛЖИРЦЫ (у Ушакова было "туземцы-алжирцы" в ст. "тюркос")
+АЛКАЛОИДЫ (у Ушакова было в толкованиях с К)
+АЛЛИЛУЙЯ (было "аллилуия" в ст. "алилуйщик/аллилуйщик" и "аллилуйя" в примерах с Л)
+АНАРХИЧНЫЙ (у Ушакова было "анархичен" в ст. "анархический", которое тоже осталось)
+АНАХРОНИЧНЫЙ (у Ушакова было "анахроничен" в ст. "анахронический", которое тоже осталось)
+АССИРИЙЦЫ (было в толкованиях с К)
+АФГАНЦЫ (у Ушакова было в толковании к ст. "иранцы")
+АФРИКАНЦЫ (было "африканец" в толковании к ст. "африканский")
+АЭРОФОТОСЪЁМКА (было в ст. "аэрофото")
совсем новые (213):
+АБАЗИНСКИЙ
+АБАЗИНЫ
+АБОРИГЕННЫЙ
+АБРАЗИВ (!!!)
+АБСТРАКЦИОНИЗМ
+АБСТРАКЦИОНИСТ
+АБХАЗСКО-АДЫГЕЙСКИЙ
+АБХАЗЫ
+АБЫ (???)
+АВАНГАРДИЗМ
+АВАНГАРДИСТ
+АВАНПОРТ
+АВАРИЙНОСТЬ
+АВАРИЙНЫЙ (у Ушакова было "безаварийно" в примере к ст. "налетать", у Ожегова исчезло)
+АВАРИЙЩИК
+АВИАМОДЕЛИЗМ
+АВИАМОДЕЛИСТ
+АВИАМОДЕЛЬ
+АВИАНОСНЫЙ (хотя было "авианосец")
+АВИАСАЛОН
+АВИЗО
+АВИТАМИНОЗ
+АВОСЬКА
+АВСТРАЛИЙЦЫ
+АВСТРАЛОИДНЫЙ
+АВСТРОАЗИАТСКИЙ
+АВСТРОНЕЗИЙСКИЙ
+АВТОБЛОКИРОВКА
+АВТОВОКЗАЛ
+АВТОГЕН
+АВТОГУЖЕВОЙ
+АВТОДОРОЖНЫЙ
+АВТОЗАВОД
+АВТОКАР
+АВТОКЛАВ
+АВТОМАТИКА (!!!)
+АВТОМАТЧИК (у Ушакова не было "автомат" в значении оружия)
+АВТОМОДЕЛИЗМ
+АВТОМОДЕЛИСТ
+АВТОМОДЕЛЬ
+АВТОМОТРИСА
+АВТОПИЛОТ
+АВТОПОГРУЗЧИК
+АВТОПОИЛКА
+АВТОРЕФЕРАТ (!!!)
+АВТОРИТАРИЗМ (хотя было "авторитарный")
+АВТОРУЧКА
+АВТОСАЛОН
+АВТОСЕРВИС
+АВТОСТОП
+АВТОСТРАДА
+АВТОСЦЕПКА
+АВТОТРАКТОРНЫЙ
+АВТОТРАНСПОРТ
+АВТОХТОННЫЙ (хотя было "автохтоны")
+АВТОЦИСТЕРНА
+АГНОСТИЦИЗМ
+АГРОКУЛЬТУРА
+АГРОПРОМЫШЛЕННЫЙ
+АГРОТЕХНИК
+АГРОТЕХНИКА (у Ушакова было "агротехнический" в толковании ст. "свеклоутомление")
+АГРОХИМИК
+АГРОХИМИЯ
+АДАПТАЦИЯ (!!!)
+АДАПТИТОВАТЬ (!!!)
+АДВЕНТИСТ
+АДЖАРСКИЙ
+АДЖАРЦЫ
+АДЪЮНКТУРА
+АДЫГИ
+АЖ/АЖНО (???)
+АЗИМУТ
+АЗУ
+АИСТЁНОК
+АИСТИХА
+АЙБОЛИТ
+АКВА
+АКВАЛАНГ
+АКВАЛАНГИСТ
+АКВАНАВТ
+АКВАПАРК
+АКВАТОРИЯ (!!!)
+АККОРДЕОН (!!!)
+АККОРДЕОНИСТ
+АККУРАТИСТ
+АКСЕЛЕРАТ
+АКСЕЛЕРАЦИЯ
+АКСИОМАТИЧНЫЙ (хотя осталось и "аксиоматический")
+АКТИВНИЧАТЬ
+АКТИРОВАТЬ
+АКУСТИК
+АКЦЕНТИРОВАТЬ
+АКЦЕНТОЛОГИЯ
+АКЫН
+АЛБАНСКИЙ
+АЛГОРИТМ
+АЛЕТЬСЯ (хотя было "заалеться", у Ожегова исчезло)
+АЛЕУТСКИЙ (хотя было "алеуты" в толковании к ст. "индейцы")
+АЛКАШ (!!!)
+АЛЛЕРГЕН
+АЛЛЕРГИК
+АЛЛЕРГИЯ (!!!)
+АЛЛЕРГО
+АЛТАЙСКИЙ
+АЛТАЙЦЫ
+АЛЫЧА (там же новое "алычовый")
+алычовый (в ст. "алыча")
+альбиносовый (в ст. "альбинос")
+АЛЬМА-МАТЕР
+АЛЬПИНАРИЙ
+АЛЬПИНИАДА
+АЛЬФА-
+амальгамный (в ст. "амальгама")
+АМБАЛ (!!!)
+АМЕРИКАНИЗИРОВАТЬ
+АМЕРИКАНИСТИКА
+АМИНОКИСЛОТЫ
+АММОНАЛ (!!!)
+АНАКОНДА
+АНАМНЕЗ
+анархо-синдикалистский (в ст. "анархо-синдикализм")
+АНАША (!!!)
+АНГЛИКАНСТВО
+анекдотец (в ст. "анекдот")
+АНЕСТЕЗИОЛОГ (хотя было "анестезировать")
+АНЕСТЕЗИОЛОГИЯ (хотя было "анестезировать")
+АНИКА-ВОИН
+АНИМАТОР (было только "мультипликатор")
+АНКЕТИРОВАТЬ (хотя было "анкета")
+АНКЛАВ
+АНОДИРОВАТЬ
+АНОНИМЩИК (хотя было "анонимка")
+АНТИБИОТИКИ
+АНТИИСТОРИЧЕСКИЙ
+АНТИИСТОРИЧНЫЙ
+АНТИКОММУНИЗМ (хотя было "антикоммунистический")
+АНТИМИРЫ
+АНТИСАНИТАРИЯ
+АНТИСАНИТАРНЫЙ
+АНТИСЕПТИК (хотя было "антисептика")
+АНТИСОВЕТИЗМ (хотя было "антисоветский")
+АНТИСТАТИК
+АНТИТЕЛА
+АНТИФАШИСТ (хотя было "антифашистский")
+АНТОНИМ (???)
+АНТОНИМИЯ (???)
+АНТОНОВСКИЙ
+АНТРОПО
+АНЮТКИ
+АПАРТЕИД
+АПАЧИ
+АПЕРИТИВ (!!!)
+АПИТЕРАПИЯ (там же новое "апитерапевтический")
+апитерапевтический (в ст. "апитерапия")
+апологетический (в ст. "апология")
+АППАРАТНАЯ (не было даже прил.)
+АПЧХИ (было только "чих")
+АРАБИСТИКА (хотя было "арабист")
+АРАТ (там же новое "аратский")
+аратский (в ст. "арат")
+АРАХИС (!!!)
+АРГЕНТИНСКИЙ
+АРГЕНТИНЦЫ
+АРГОН
+АРЕАЛ (!!!)
+АРМРЕСТЛИНГ
+АРТИКЛЬ (у Ушакова "член")
+АРХАИЗИРОВАТЬ (хотя было "архаизм", "архаический/архаичный")
+АРХАИКА (хотя было "архаизм", "архаический/архаичный")
+АРХАР
+АС
+АСКОРБИНКА
+АСКОРБИНОВЫЙ
+АСПИДНО-
+АССИРИЙСКИЙ
+АССОРТИ
+АСТЕНИЧНЫЙ (было только "астенический")
+АСТРО
+АСТРОНАВТ
+АСТРОНАВТИКА
+АТЛАНТ
+АТЛЕТИЗМ (хотя было "атлет/атлёт")
+АТОМАРНЫЙ
+АТОМНИК (хотя есть "атомщик")
+АТОМОХОД
+АТОМЩИК (хотя есть "атомник")
+АУДИЕНЦ-ЗАЛ
+АУДИО (у Ушакова не было ни одного слова с этой приставкой)
+АУКЦИОНЕР (!!!)
+АУРА (!!!)
+АУТОГЕННЫЙ
+АУТОТРЕНИНГ
+АУТСАЙДЕР
+АФГАНИ
+АФГАНСКИЙ
+афористичность (в ст. "афористичный", хотя было "афористический/афористичный")
+АФРАЗИЙСКИЙ
+АФРИКАНИСТИКА
+аффектированность (в ст. "аффектированный")
+АФФИКС (!!!)
+АЦЕТАТЫ (!!!)
+АЦЕТОН (!!!)
+АЦТЕКИ (!!!)
+АЦТЕКСКИЙ
+АШУГ
+АЭРАЦИЯ
+АЭРОБИКА
+АЭРОБУС
+АЭРОВОКЗАЛ
+АЭРОЗОЛИ (!!!)
+АЭРОЛОГ (хотя было "аэрология")
+АЭРОМЕХАНИКА
+АЯТОЛЛА (!!!)
Убраны слова:
остались в примерах и толкованиях (3):
-АДАМ (осталось в толкованиях)
-АНГОРСКИЙ (осталось в примере к ст. "кошка" и в толковании к ст. "мохер")
-АНТИОБЩЕСТВЕННЫЙ (!!! осталось в толкованиях к ст. "порядочность" и "сброд")
убраны полностью (266):
-АА
-АБАЗ
-АБАКА
-АБОНИРОВАТЬСЯ (хотя осталось "абонировать")
-АБОРДИРОВАТЬ
-АБОРДИРОВАТЬСЯ
-АБРИКОСОВКА
-АБРИКОТИН
-АБСЕНТ (!!!)
-АБСЕНТЕИСТ (хотя осталось "абсентеизм" и к нему "абсентеистский")
-АБСОЛЮТИСТ (хотя осталось "абсолютизм" и к нему "абсолютистский")
-АБСОРБИРОВАТЬ
-АБСОРБИРОВАТЬСЯ
-АБСОРБЦИЯ (!!!)
-АБСЦИССА (!!!)
-АБУЛИЯ
-АБЦУГ
-АВАНСИРОВАТЬСЯ (хотя осталось "авансировать")
-АВАНТАЖ
-АВАНТАЖНЫЙ
-АВГУР
-АВГУСТЕЙШИЙ (!!!)
-АВИАТИКА
-АВИЕТКА
-АВРОРА
-АВСТРИЯК
-АВСТРИЯЧКА
-АВТОКРАТ
-АВТОКРАТИЧЕСКИЙ
-АВТОКРАТИЯ (!!!)
-АВТОНОМИСТ (хотя осталось "автономия")
-АВТОРИЗАЦИЯ (!!!)
-АВТОРИЗОВАННЫЙ
-АВТОРИЗОВАТЬСЯ
-АВТОСАНИ
-АВТОСАННЫЙ
-АВТОСМЕСЬ
-АВТОТИПИЧЕСКИЙ
-АВТОТИПИЯ
-АГАВА
-АГЕНТША (!!! у слова "агент" вообще не дана женская форма)
-АГИТПРОП
-АГЛОМЕРАТ/АГГЛОМЕРАТ/АГЛОМЕРИТ/АГГЛОМЕРИТ (!!!)
-АГОРАФОБИЯ
-АГРАМАНТ
-АГРАРНИК (хотя осталось "аграрий")
-АГРАФ
-АГРИКУЛЬТУРНЫЙ
-АГРОМАКСИМУМ
-АГРОМИНИМУМ
-АГУШЕНЬКИ (хотя осталось "агу")
-АДАМАНТ
-АДАМАНТОВЫЙ
-АДВОКАТСТВОВАТЬ
-АДМИРАЛЬША
-АДЮЛЬТЕР (!!!)
-АДЮЛЬТЕРНЫЙ
-АЖИО/ЛАЖ
-АЗАРТНИЧАТЬ
-АЗБУЧКА
-АЗЕФОВЩИНА
-АЗИАТЧИНА
-АЗИЙСКИЙ
-АЗОТИСТЫЙ
-АЗЯМ
-АИ
-АИР
-АЙРАН
-ак
-академ
-АКАДЕМИСТ
-АКАНТ
-АКВИЛОН
-АКРЕДИТОВАТЬСЯ/АККРЕДИТОВАТЬСЯ (хотя осталось "аккредитовать")
-АКМЕИСТСКИЙ (хотя осталось "акмеист")
-АКОНИТ
-АКРОБАТНИЧАТЬ
-АКСАМИТ
-АКТЕАТР
-АКТИВИЗМ (хотя осталось "активист")
-актный (хотя осталось "одноактный" в ст. "одно" и "трёхактный" в ст. "трёх")
-АКЦЕПТ
-АКЦЕПТОВАННЫЙ
-АКЦЕПТОВАТЬ
-АКЦЕПТОВАТЬСЯ
-АКЦИЗНИК (хотя осталось "акцизный" в ст. "акциз")
-АЛАРМИСТ
-АЛАРМИСТСКИЙ
-АЛГЕБРАИСТ
-АЛЕКСАНДРИЙСКИЙ
-АЛИМЕНТЩИЦА (!!! хотя осталось "алиментщик")
-АЛЛЕГРИ
-АЛЛИТЕРАЦИЯ (!!!)
-АЛИЛУЙНЫЙ/АЛЛИЛУЙНЫЙ (хотя осталось "аллилуйя")
-АЛИЛУЙЩИК/АЛЛИЛУЙЩИК (хотя осталось "аллилуйя")
-АЛИЛУЙЩИНА/АЛЛИЛУЙЩИНА (хотя осталось "аллилуйя")
-АЛОГИЗМ (!!! "нелогичность" нет и не было)
-АЛОГИЧЕСКИЙ/АЛОГИЧНЫЙ (!!! хотя "нелогичный" осталось в толкованиях)
-АЛТЫННИК
-АЛЧБА
-АЛЬ-ПАРИ
-АЛЬБИНИЗМ (хотя осталось "альбинос")
-АЛЬБИОН
-АЛЬБУМИННЫЙ
-АЛЬМАВИВА
-АЛЬПАГА
-АЛЬПАКА
-АЛЬТЕРАЦИЯ (!!!)
-АЛЬТЕРНАЦИЯ
-АЛЬФОНС (!!!)
-АМАЗОНСКИЙ (!!!)
-АМАЛЬГАМИРОВАТЬ (хотя осталось "амальгама" и там же новое "амальгамный")
-АМБРА
-АМБРЕ
-АМБУШЮР
-АМЕРИКАНИЗМ (хотя появилось "американистика")
-АМИКОШОНСТВОВАТЬ
-АМНИСТИРОВАТЬСЯ (хотя осталось "амнистировать")
-АМОРТИЗИРОВАТЬСЯ (хотя осталось "амортизировать")
-АМПЛИФИКАЦИЯ
-АМПУТИРОВАТЬСЯ (хотя осталось "ампутировать")
-АМУРИТЬСЯ (хотя осталось "амуры")
-АМУРНИЧАТЬ (хотя осталось "амуры")
-АНАБАПТИЗМ
-АНАБАПТИСТ
-АНАБАПТИСТКА
-АНАБАПТИСТСКИЙ
-АНАГРАММА (!!!)
-АНАКРЕОНТИЧЕСКИЙ
-АНАКРУЗА
-АНАЛИЗИРОВАТЬСЯ (хотя осталось "анализировать")
-АНАЛИТИКА
-АНАЛОГИЧЕСКИЙ
-АНАЛЬНЫЙ
-АНАРХОСИНДИКАЛИСТ (хотя появилось "анархо-синдикалистский" в ст. "анархо-синдикализм")
-АНАТОМ (хотя осталось "анатомия")
-АНАТОМИРОВАТЬСЯ (хотя осталось "анатомировать")
-АНАФЕМАТСТВОВАТЬ (хотя осталось "анафема")
-АНАФЕМСКИЙ (хотя осталось "анафема")
-АНГАЖИРОВАТЬСЯ (хотя осталось "ангажировать")
-АНГЛИЗИРОВАТЬ
-АНГЛИЗИРОВАТЬСЯ
-АНГЛОМАНИЯ (хотя осталось "англоман")
-АНГЛОМАНСТВО (хотя осталось "англоман")
-АНГЛОФИЛ
-АНГЛОФИЛЬСКИЙ
-АНГЛОФИЛЬСТВО
-АНГЛОФОБСКИЙ
-АНГЛОФОБСТВО
-АНЕВРИЗМ/АНЕВРИЗМА (!!!)
-АНЕКДОТИСТ (хотя осталось "анекдот")
-АНЕМОН
-АНЕРОИД
-АНЕСТЕЗИРОВАТЬСЯ (хотя осталось "анестезировать")
-АНКЕР
-АНКЕРНЫЙ
-АННЕКСИРОВАТЬСЯ (хотя осталось "аннексировать")
-АННОТИРОВАТЬСЯ (хотя осталось "аннотировать")
-АННУЛИРОВАТЬСЯ (хотя осталось "аннулировать")
-АНОНСИРОВАТЬСЯ (хотя осталось "анонсировать")
-АНОНСОДАТЕЛЬ (хотя осталось "анонсировать")
-АНТАБЛЕМЕНТ
-АНТАНТА
-АНТАНТОВСКИЙ
-АНТИАЛКОГОЛЬНЫЙ (!!!)
-АНТИКВА
-АНТИКРИТИКА
-АНТИМАРКСИСТСКИЙ
-АНТИМИЛИТАРИЗМ
-АНТИМИЛИТАРИСТ
-АНТИМИНС
-АНТИОБЩЕСТВЕННИК
-АНТИПАТИЧЕСКИЙ (хотя осталось "антипатия" и там "антипатичный")
-АНТИПИРИН
-АНТИРЕЛИГИОЗНИК (хотя осталось "антирелигиозный")
-АНТИРЕЛИГИОЗНИЦА (хотя осталось "антирелигиозный")
-АНТИСЕМИТСТВОВАТЬ (хотя осталось "антисемитизм")
-АНТИТЕТИЧЕСКИЙ (хотя осталось "антитезис")
-АНТИЦИПИРОВАТЬСЯ
-АНТРАЦЕН
-АНТРАЦЕНОВЫЙ
-АНТРЕПРИЗА (хотя осталось "антрепренёр")
-АНТРОПОМЕТРИЧЕСКИЙ (хотя осталось "антропометрия" в ст. "антропо")
-АНТРОПОСОФ
-АНТРОПОСОФИЯ
-АНТРОПОСОФКА
-АНТРОПОСОФСКИЙ
-АНТУКА
-АОРИСТ (!!!)
-АПЕЛЛЯНТ (хотя осталось "апелляция")
-АПЕРЦИПИРОВАТЬ (хотя осталось "аперцепция")
-АПЕРЦИПИРОВАТЬСЯ (хотя осталось "аперцепция")
-АПОДИКТИЧЕСКИЙ
-АПОЛОГЕТИКА (хотя появилось "апологетический" в ст. "апология")
-АПОРТ (междометие)
-АПЛИКАТУРА/АППЛИКАТУРА (!!!)
-АПЛИКЕ (хотя осталось "сусальный")
-АПРЕТУРА/АППРЕТУРА
-АПРЕТУРНЫЙ/АППРЕТУРНЫЙ
-АПРОБИРОВАТЬСЯ (хотя осталось "апробировать")
-АПРОШ
-АРАБИЗМ
-АРАВИТЯНИН
-АРАВИТЯНКА
-АРАК
-АРАНЖИРОВАТЬСЯ (хотя осталось "аранжировать")
-АРГУМЕНТИРОВАТЬСЯ (хотя осталось "аргументировать")
-АРГУС
-АРЕД
-АРЕДОВ
-АРЕНДОВАНИЕ (хотя осталось "арендовать")
-АРЕНДОВАТЬСЯ (хотя осталось "арендовать")
-АРЕСТОВАТЬСЯ (хотя осталось "арестовать") - NB р вместо рр
-АРЕСТОВЫВАТЬСЯ (хотя осталось "арестовывать" в ст. "арестовать") - NB р вместо рр
-АРИТМИЧНЫЙ ("неритмичный" было в толковании к "аритмичный", тоже исчезло)
-АРИФМЕТИК
-АРИФМОГРАФ
-АРКАД
-АРКАДИЯ
-АРКАДСКИЙ
-АРМЕЙЩИНА
-АРМЯНОГРЕГОРИАНСКИЙ
-АРМЯЧИНА
-АРНИКА
-АРПЕДЖИО (!!!)
-АРТРИТИЗМ (хотя осталось "артрит")
-АРТРИТИК (хотя осталось "артрит")
-АРТРИТИЧЕСКИЙ (хотя осталось "артрит")
-АРТРИТИЧКА (хотя осталось "артрит")
-АРХИПАСТЫРСКИЙ
-АРХИПАСТЫРЬ
-АРХИТРАВ
-АРШИННИК
-АСИГНОВАТЬСЯ/АССИГНОВАТЬСЯ (хотя осталось "ассигновать")
-АСИГНОВЫВАТЬ/АССИГНОВЫВАТЬ (хотя осталось "ассигновать")
-АСИГНОВЫВАТЬСЯ/АССИГНОВЫВАТЬСЯ (хотя осталось "ассигновать")
-АСКЕР
-АСПИРИН (!!!)
-АСТРАХАНКА
-АСФАЛЬТИРОВАТЬСЯ (хотя осталось "асфальтировать")
-АТАКОВАТЬСЯ (хотя осталось "атаковать") - NB т вместо тт
-АТАМАНСТВОВАТЬ (хотя осталось "атаман")
-АТАНДЕ
-АТОМНОСТЬ (хотя осталось "атомный" в ст. "атом")
-АТОНИЧЕСКИЙ
-АТОНИЯ
-АТРОПИН
-АТТИЧЕСКАЯ
-АТЕСТОВАННЫЙ/АТТЕСТОВАННЫЙ (!!!)
-АТЕСТОВАТЬСЯ/АТТЕСТОВАТЬСЯ
-АТУКАТЬ (хотя осталось "ату")
-АУСПИЦИИ
-АФАЗИЯ (!!!)
-АФЕЛИЙ (!!!)
-АФИНЕРНЫЙ/АФФИНЕРНЫЙ
-АФИНИРОВАТЬ/АФФИНИРОВАТЬ
-АФИНИРОВАТЬСЯ/АФФИНИРОВАТЬСЯ
-АФИНСКИЕ ВЕЧЕРА/НОЧИ (хотя осталось "афинский" в примере к ст. "акрополь")
-АФИШИРОВАТЬСЯ (хотя осталось "афишировать")
-АФИШКА
-АФЕКТИРОВАТЬ (хотя осталось "аффектированный" и там же новое "аффектированность")
-АХРОМАТИЗМ
-АХРОМАТИЧЕСКИЙ (!!!)
-ахтительный
-аэрофото
-АЭРОФОТОГРАФИЯ
Слов "ажно", "анаша", "аперитив", "апитерапия", "аура" нет в 9-м издании. Похоже, это творчество Шведовой. Она же убрала слово "аспирин".
Цитата: Alone Coder от августа 17, 2012, 19:34
Она же убрала слово "аспирин".
Это заговор, инфа 146%.
Предложите способы определить объём словника толковательной части (без примеров и без вторых-третьих слов в гнёздах)!
Хотя бы приблизительно.