Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Сравнение словников

Автор Alone Coder, августа 13, 2012, 08:50

0 Пользователи и 1 гость просматривают эту тему.

Alone Coder

Подкиньте программку под Windows XP, которая сравнит два отсортированных текстовых файла типа
file1.txt:
А
Б
В
Д
file2.txt:
А
В
Г

И даст результат в виде:



Alone Coder

fc ushakov_words_nodup.txt ozhegov_words_sort_nodup.txt > fc.txt
сравнил меньше половины.

fc /lb100000 ushakov_words_nodup.txt ozhegov_words_sort_nodup.txt > fc.txt
повис.

И вообще, выводит в таком адском порядке, что нужный мне из него не получить.
Иначе я не смогу узнать, какие слова только изменили написание от Ушакова к Ожегову!

Alone Coder

diff -u ushakov_words_nodup.txt ozhegov_words_sort_nodup.txt > diff_u.txt
даёт примерно то, что нужно, только добавляет одинаковые строки.

Python

Скачайте sed (например, вместе с unxutils) и попробуйте следующее:

diff -u ushakov_words_nodup.txt ozhegov_words_sort_nodup.txt | sed "/^[+\-]/!d" > diff_u_sed.txt
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Alone Coder

Словник Ушакова (включая заголовки мелким шрифтом) - 85582 слов.
Словник Ожегова-Шведовой 1992 - 39619 слов.
Всё не считая одинаковых заголовков для вторых значений.

Excel подавился.

Тайльнемер

Написать велосипед быстрее, чем найти в точности то, что нужно. Вы же кодер :)

Bhudh

Цитата: Alone Coder от августа 13, 2012, 08:50Подкиньте программку под Windows XP, которая сравнит два отсортированных текстовых файла
WinMerge.
Плюсы и минусы будут видны в виде подсветки, что, Ι℧, удобнее.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Alone Coder

Нет, подсветку нельзя редактировать. Я уже сделал один проход по полученному списку. Ещё никогда не работал с такими большими списками. В исходных текстах было чудовищное количество опечаток. У Ушакова вообще отрезали статьи с середины и пихали в другой конец документа. Многие статьи пока не нашёл, хотя ссылки на них есть.

Hellerick

Цитата: Alone Coder от августа 13, 2012, 10:44
Excel подавился.

Странно. Вроде бы, для него это простейшая задача.
Словники не подкинете?

Alone Coder

Текущая версия (исправляю по мере нахождения опечаток):

Alone Coder

Цитата: Hellerick от августа 14, 2012, 07:35
Странно. Вроде бы, для него это простейшая задача.
Больше 65536 строк не умеет.

Hellerick

Цитата: Alone Coder от августа 14, 2012, 07:39
Цитата: Hellerick от августа 14, 2012, 07:35
Странно. Вроде бы, для него это простейшая задача.
Больше 65536 строк не умеет.

У меня этих строк 1048576  ;)

Hellerick

Составил список пар слов, которые стоят рядом по алфавиту, находятся в разных словарях, и имеют между собой расстояние Левенштейна равное единице.

Правда, там мусор в основном. Но есть и интересные пары.

Alone Coder

Забавный инструмент!
А вот что я накопал вручную: оказывается, словарь Ожегова вовсе не такой уж маленький! Просто заглавные слова из Ушакова попали внутрь статей. Например:

-АА
-АБАЗ
-АБАКА
+АБАЗИНСКИЙ
+АБАЗИНЫ
*АББАТИССА>АББАТИСА
-АББАТСКИЙ (ушло в ст. "аббат")
-АБЕРАЦИОННЫЙ/АБЕРРАЦИОННЫЙ (ушло в ст. "аберрация")
*АБЕРАЦИЯ/АБЕРРАЦИЯ>АБЕРРАЦИЯ
*АБРЕВИАТУРА/АБРЕВИАЦИЯ>АББРЕВИАТУРА
+АБИССИНЦЫ (у Ушакова было в толковании ст. "эфиоп")
-АБОНЕМЕНТНЫЙ (ушло в ст. "абонемент")
!АБОНЕНТНЫЙ>абонентский (в ст. "абонент")
-АБОНИРОВАННЫЙ (хотя осталось "абонировать")
-АБОНИРОВАТЬСЯ (хотя осталось "абонировать")
-АБОРДАЖНЫЙ (ушло в ст. "абордаж")
-АБОРДИРОВАТЬ
-АБОРДИРОВАТЬСЯ
+АБОРИГЕННЫЙ
+АБРАЗИВ (!!!)
-АБРИКОСНЫЙ (ушло в ст. "абрикос")
-АБРИКОСОВКА
-АБРИКОТИН
-АБСЕНТ (!!!)
-АБСЕНТЕИСТ (хотя осталось "абсентеизм" и к нему "абсентеистский")
-АБСОЛЮТИСТ (хотя осталось "абсолютизм" и к нему "абсолютистский")
-АБСОЛЮТИСТСКИЙ (ушло в ст. "абсолютизм")
-АБСОЛЮТНО (ушло в ст. "абсолютный")
-АБСОЛЮТНОСТЬ (ушло в ст. "абсолютный")
-АБСОРБИРОВАТЬ
-АБСОРБИРОВАТЬСЯ
-АБСОРБЦИЯ (!!!)
-АБСТРАКТНОСТЬ (ушло в ст. "абстрактный")
+АБСТРАКЦИОНИЗМ
+АБСТРАКЦИОНИСТ
-АБСУРДНОСТЬ (ушло в ст. "абсурдный")
-АБСЦИССА (!!!)
-АБУЛИЯ
-АБЦУГ
+АБХАЗСКИЙ (у Ушакова было в примере к ст. "гибрид" и в толковании к ст. "лазы")
+АБХАЗСКО-АДЫГЕЙСКИЙ
+АБХАЗЫ
+АБЫ (???)
-АВАНГАРДНЫЙ (ушло в ст. "авангард")
!АВАНЗАЛА>АВАНЗАЛ
+АВАНГАРДИЗМ
+АВАНГАРДИСТ
+АВАНПОРТ
-АВАНПОСТНЫЙ (ушло в ст. "аванпост")
-АВАНСИРОВАТЬСЯ (хотя осталось "авансировать")
-АВАНСОВЫЙ (ушло в ст. "аванс")
-АВАНТАЖ
-АВАНТАЖНЫЙ
-АВАНТЮРИСТКА (ушло в ст. "авантюрист")
!АВАНТЮРИСТСКИЙ>АВАНТЮРИСТИЧНЫЙ
+АВАРИЙНОСТЬ
+АВАРИЙНЫЙ (у Ушакова было "безаварийно" в примере к ст. "налетать", у Ожегова исчезло)
+АВАРИЙЩИК
-АВАРКА (ушло в ст. "аварцы")
!АВГИЕВЫ>АВГИЕВ
-АВГУР
-АВГУСТЕЙШИЙ (!!!)
-АВГУСТОВСКИЙ (ушло в ст. "август")
-АВИАМАТКА
+АВИАМОДЕЛИЗМ
+АВИАМОДЕЛИСТ
+АВИАМОДЕЛЬ
-АВИАТИКА
+АВИАНОСНЫЙ ("авианосец" было и осталось)
!АЭРОПОЧТА>АВИАПОЧТА
+АВИАСАЛОН
-АВИАТОРСКИЙ (ушло в ст. "авиатор")
-АВИАЦИОННЫЙ (ушло в ст. "авиация")
-АВИЕТКА
*АВИА/авио>АВИА
+АВИЗО
+АВИТАМИНОЗ
+АВОСЬКА
-АВРАЛЬНЫЙ (ушло в ст. "аврал")
-АВРОРА
-АВСТРИЙКА (ушло в ст. "австрийцы")
+АВСТРАЛИЙСКИЙ (у Ушакова было в толкованиях с Б)
+АВСТРАЛИЙЦЫ
+АВСТРАЛОИДНЫЙ
-АВСТРИЯК
-АВСТРИЯЧКА
+АВСТРОАЗИАТСКИЙ
+АВСТРОНЕЗИЙСКИЙ
!АВТЕНТИЧЕСКИЙ/АВТЕНТИЧНЫЙ>АУТЕНТИЧНЫЙ
-АВТОБИОГРАФИЧНОСТЬ (ушло в ст. "автобиографичный")
+АВТОБЛОКИРОВКА
-АВТОБУСНЫЙ (ушло в ст. "автобус")
+АВТОВОКЗАЛ
+АВТОГЕН
!АВТОЖИР/АВТОГИР/ВЕРТОЛЁТ>ВЕРТОЛЁТ
-АВТОГРАФИЧЕСКИЙ (ушло в ст. "автограф")
!САМОУЧКА/АВТОДИДАКТ>САМОУЧКА
-АВТОКРАТ
-АВТОКРАТИЧЕСКИЙ
-АВТОКРАТИЯ (!!!)
+АВТОГУЖЕВОЙ
+АВТОДОРОЖНЫЙ
+АВТОЗАВОД
+АВТОКАР
+АВТОКЛАВ
-АВТОМАТИЗАЦИЯ (ушло в ст. "автоматизировать")
+АВТОМАТИКА (!!!)
+АВТОМАТЧИК (у Ушакова не было "автомат" в значении оружия)
+АВТОМАШИНА (у Ушакова было в толкованиях с М)
-АВТОМОБИЛИСТКА (ушло в ст. "автомобилист")
-АВТОМОБИЛЬНЫЙ (ушло в ст. "автомобиль")
-АВТОНОМИСТ (хотя осталось "автономия")
+АВТОМОДЕЛИЗМ
+АВТОМОДЕЛИСТ
+АВТОМОДЕЛЬ
+АВТОМОТРИСА
+АВТОПИЛОТ
+АВТОПОГРУЗЧИК
+АВТОПОИЛКА
-АВТОРИЗАЦИЯ (!!!)
-АВТОРИЗОВАННЫЙ
+АВТОРЕФЕРАТ (!!!)
-АВТОРИЗОВАТЬСЯ
+АВТОРИТАРИЗМ ("авторитарный" было и осталось)
-АВТОРИТЕТНОСТЬ (ушло в ст. "авторитетный")
-АВТОРСКИЙ (ушло в ст. "автор")
-АВТОСАНИ
-АВТОСАННЫЙ
-АВТОСМЕСЬ
-АВТОТИПИЧЕСКИЙ
-АВТОТИПИЯ
+АВТОРУЧКА
+АВТОСАЛОН
+АВТОСЕРВИС
+АВТОСТОП
+АВТОСТРАДА
+АВТОСЦЕПКА
+АВТОТРАКТОРНЫЙ
+АВТОТРАНСПОРТ
!АВТОХТОНЫ/АУТОХТОНЫ>АВТОХТОНЫ
+АВТОХТОННЫЙ ("автохтоны" было и осталось)
+АВТОЦИСТЕРНА
-АГАВА
-АГАТОВЫЙ (ушло в ст. "агат")
-АГЕНТСКИЙ (ушло в ст. "агент")
-АГЕНТУРНЫЙ (ушло в ст. "агентура")
-АГЕНТША (!!! у слова "агент" вообще не дана женская форма)
-АГИТАТОРСКИЙ (ушло в ст. "агитатор")
-АГИТАЦИОННЫЙ (ушло в ст. "агитация")
-АГИТПРОП
+АГИТПУНКТ (было в примерах к ст. "агит")
-АГЛОМЕРАТ/АГГЛОМЕРАТ/АГЛОМЕРИТ/АГГЛОМЕРИТ (!!!)
+АГНОСТИК (у Ушакова было в примерах с О)
+АГНОСТИЦИЗМ
-АГОРАФОБИЯ
-АГРАМАНТ
-АГРАРНИК (хотя осталось "аграрий")
-АГРАФ
-АГРЕССИВНОСТЬ (ушло в ст. "агрессивный")
-АГРИКУЛЬТУРНЫЙ
-АГРОМАКСИМУМ
-АГРОМИНИМУМ
+АГРОКУЛЬТУРА
-АГРОНОМИЧЕСКИЙ (ушло в ст. "агрономия")
+АГРОПРОМЫШЛЕННЫЙ
+АГРОТЕХНИК
+АГРОТЕХНИКА (у Ушакова было "агротехнический" в толковании ст. "свеклоутомление")
+АГРОХИМИК
+АГРОХИМИЯ
-АГУШЕНЬКИ (хотя осталось "агу")
-АДАМ (хотя осталось в толкованиях)
-АДАМАНТ
-АДАМАНТОВЫЙ
+АДАПТАЦИЯ (!!!)
+АДАПТИТОВАТЬ (!!!)
+АДВЕНТИСТ
-АДВОКАТСКИЙ (ушло в ст. "адвокат")
-АДВОКАТСТВОВАТЬ
!АДЕНОИД>АДЕНОИДЫ
*АДЭКВАТНЫЙ>АДЕКВАТНЫЙ
!ЧЕРКЕСЫ/АДЕХ>ЧЕРКЕСЫ
-АДМИНИСТРАТИВНЫЙ (ушло в ст. "администрация")
+АДЖАРСКИЙ
+АДЖАРЦЫ
-АДМИНИСТРАТОРСКИЙ (ушло в ст. "администратор")
-АДМИНИСТРИРОВАНИЕ (ушло в ст. "администрировать")
-АДМИРАЛТЕЙСКИЙ (ушло в ст. "адмиралтейство")
-АДМИРАЛЬСКИЙ (ушло в ст. "адмирал")
-АДМИРАЛЬША
!АДРЕСАНТ/ОТПРАВИТЕЛЬ>ОТПРАВИТЕЛЬ
-АДРЕСНЫЙ (ушло в ст. "адрес")
-АДРЕСОВАННЫЙ (ушло в ст. "адресовать")
-АДСКИ (ушло в ст. "адский")
+АДЪЮНКТУРА
-АДЪЮТАНТСКИЙ (ушло в ст. "адъютант")
-АДЮЛЬТЕР (!!!)
-АДЮЛЬТЕРНЫЙ
-АЖИО/ЛАЖ
+АДЫГЕЙСКИЙ (у Ушакова было в толкованиях с А)
+АДЫГЕЙЦЫ (у Ушакова было в толковании к ст. "черкесы")
+АДЫГИ
+АЖ/АЖНО (???)
-АЗАРТНИЧАТЬ
-АЗБЕСТ/АСБЕСТ>АСБЕСТ
-АЗБЕСТОВЫЙ/АСБЕСТОВЫЙ>асбестовый (в ст. "асбест")
-АЗБУЧКА
-АЗБУЧНЫЙ (ушло в ст. "азбука")
-АЗЕФОВЩИНА
!АЗИАТ>АЗИАТЫ
-АЗИАТКА (ушло в ст. "азиаты")
+АЗБУКА (??? было "азбучка", "азбучный")
+АЗЕРБАЙДЖАНСКИЙ (у Ушакова было в толкованиях с Т)
+АЗЕРБАЙДЖАНЦЫ (у Ушакова было в толкованиях с Т)
-АЗИАТЧИНА
-АЗИЙСКИЙ
+АЗИМУТ
-АЗОТИСТЫЙ
-АЗЯМ
-АИ
-АИР
+АЗУ
+АИСТЁНОК
+АИСТИХА
+АЙБОЛИТ
-АЙРАН
-ак
-академ
-АКАДЕМИСТ
-АКАНТ
-АКАНЬЕ (ушло в ст. "акать")
-АКАЮЩИЙ (ушло в ст. "акать")
+АКВА
+АКВАЛАНГ
+АКВАЛАНГИСТ
!АКВАМАРИННЫЙ/АКВАМАРИНОВЫЙ>АКВАМАРИНОВЫЙ
+АКВАНАВТ
+АКВАПАРК
-АКВАРЕЛИСТКА (ушло в ст. "акварелист")
-АКВАРЕЛЬНЫЙ (ушло в ст. "акварель")
!АКВАРИЙ/АКВАРИУМ>АКВАРИУМ
+АКВАТОРИЯ (!!!)
-АКВИЛОН
*АКЛИМАТИЗИРОВАТЬ/АККЛИМАТИЗИРОВАТЬ>АККЛИМАТИЗИРОВАТЬ
*АКЛИМАТИЗИРОВАТЬСЯ/АККЛИМАТИЗИРОВАТЬСЯ>АККЛИМАТИЗИРОВАТЬСЯ
*АКОМОДАЦИЯ/АККОМОДАЦИЯ>АККОМОДАЦИЯ
*АКОМОДАЦИОННЫЙ/АККОМОДАЦИОННЫЙ>аккомодационный (в ст. "аккомодация")
*АКОМПАНЕМЕНТ/АККОМПАНЕМЕНТ>АККОМПАНЕМЕНТ
*АКОМПАНИАТОР/АККОМПАНИАТОР>АККОМПАНИАТОР
*АКОМПАНИАТОРША/АККОМПАНИАТОРША>аккомпаниаторша (в ст. "аккомпаниатор")
*АКОМПАНИРОВАТЬАККОМПАНИРОВАТЬ/>АККОМПАНИРОВАТЬ
*АКОРД/АККОРД>АККОРД
*АКОРДНЫЙ/АККОРДНЫЙ>АККОРДНЫЙ
+АККОРДЕОН (!!!)
+АККОРДЕОНИСТ
*АКРЕДИТИВ/АККРЕДИТИВ>АККРЕДИТИВ
*АКРЕДИТИВНЫЙ/АККРЕДИТИВНЫЙ>аккредитивный (в ст. "аккредитив")
*АКРЕДИТОВАННЫЙ/АККРЕДИТОВАННЫЙ>аккредитованный (в ст. "аккредитовать")
-АКРЕДИТОВАТЬСЯ/АККРЕДИТОВАТЬСЯ (хотя осталось "аккредитовать")
*АКРЕДИТОВАТЬ/АККРЕДИТОВАТЬ>АККРЕДИТОВАТЬ
-АККУМУЛЯТОРНЫЙ (ушло в ст. "аккумулятор")
*АКЛИМАТИЗАЦИОННЫЙ/АККЛИМАТИЗАЦИОННЫЙ>акклиматизационный (в ст. "акклиматизировать")
*АКЛИМАТИЗАЦИЯ/АККЛИМАТИЗАЦИЯ>акклиматизация (в ст. "акклиматизировать")
*АКУРАТ>АККУРАТ
+АККУРАТИСТ
*АКУРАТНЫЙ/АККУРАТНЫЙ>АККУРАТНЫЙ
*АКУРАТНО/АККУРАТНО>аккуратно (в ст. "аккуратный")
*АКУРАТНОСТЬ/АККУРАТНОСТЬ>аккуратность (в ст. "аккуратный")
-АКМЕИСТКА (ушло в ст. "акмеист")
-АКМЕИСТСКИЙ (хотя осталось "акмеист")
-АКОНИТ

Alone Coder

!АКРОБАТИЧЕСКИЙ/АКРОБАТИЧНЫЙ>акробатический (ушло в ст. "акробатика")
!АКРОБАТИЧНОСТЬ/АКРОБАТИЗМ>АКРОБАТИЗМ
-АКРОБАТКА (ушло в ст. "акробат")
-АКРОБАТНИЧАТЬ
-АКСАМИТ
+АКСЕЛЕРАТ
+АКСЕЛЕРАЦИЯ
*АКСЕСУАР/АКСЕССУАР>АКСЕССУАР
+АКСИОМАТИЧНЫЙ (хотя осталось и "аксиоматический")
-АКТЕАТР
!АКТРИСА/АКТЁРКА>АКТРИСА
-АКТЁРСКИЙ (ушло в ст. "актёр")
-АКТИВИЗАЦИЯ (ушло в ст. "активизировать")
-АКТИВИЗМ (хотя осталось "активист")
-АКТИВИСТКА (ушло в ст. "активист")
-АКТИВИСТСКИЙ (ушло в ст. "активист")
-АКТИВНОСТЬ (ушло в ст. "активный")
+АКТИВНИЧАТЬ
-актный (хотя осталось "одноактный" в ст. "одно" и "трёхактный" в ст. "трёх")
-АКТОВЫЙ (ушло в ст. "акт")
+АКТИРОВАТЬ
-АКТУАЛЬНОСТЬ (ушло в ст. "актуальный")
-АКУЛИЙ (ушло в ст. "акула")
+АКУСТИК
-АКУСТИЧЕСКИЙ (ушло в ст. "акустика")
-АКУШЕРСКИЙ (ушло в ст. "акушер/акушёр")
-АКЦЕПТ
-АКЦЕПТОВАННЫЙ
-АКЦЕПТОВАТЬ
-АКЦЕПТОВАТЬСЯ
-АКЦИЗНИК (хотя осталось "акцизный" в ст. "акциз")
-АКЦИЗНЫЙ (ушло в ст. "акциз")
+АКЦЕНТИРОВАТЬ
+АКЦЕНТОЛОГИЯ
-АКЦИОНЕРНЫЙ (ушло в ст. "акция")
-АКЦИОНЕРСКИЙ (ушло в ст. "акционер")
-АЛАРМИСТ
-АЛАРМИСТСКИЙ
+АКЫН
+АЛБАНСКИЙ
!АРНАУТКА>АЛБАНЦЫ
-АЛГЕБРАИСТ
-АЛГЕБРАИЧЕСКИЙ (ушло в ст. "алгебра")
+АЛГОРИТМ
-АЛЕКСАНДРИЙСКИЙ
+АЛЕТЬСЯ (хотя было "заалеться", у Ожегова исчезло)
+АЛЕУТСКИЙ (хотя было "алеуты" в толковании к ст. "индейцы")
+АЛЕУТЫ (было в толковании к ст. "индейцы")
+АЛЖИРСКИЙ (у Ушакова было в толкованиях с З)
+АЛЖИРЦЫ (у Ушакова было "туземцы-алжирцы" в ст. "тюркос")
-АЛИЗАРИНОВЫЙ (ушло в ст. "ализарин")
-АЛИМЕНТНЫЙ (ушло в ст. "алименты")
-АЛИМЕНТЩИЦА (!!! хотя осталось "алиментщик")
+АЛКАЛОИДЫ (у Ушакова было в толкованиях с К)
+АЛКАШ (!!!)
-АЛКОГОЛИЧЕСКИЙ (ушло в ст. "алкоголизм")
-АЛКОГОЛЬНЫЙ (ушло в ст. "алкоголь")
!КОРАН/АЛКОРАН>КОРАН
-АЛЛЕГРИ
+АЛЛЕРГЕН
+АЛЛЕРГИК
+АЛЛЕРГИЯ (!!!)
+АЛЛЕРГО
-АЛЛИТЕРАЦИЯ (!!!)
*АЛИГАТОР/АЛЛИГАТОР>АЛЛИГАТОР
+АЛЛИЛУЙЯ (было "аллилуия" в ст. "алилуйщик/аллилуйщик" и "аллилуйя" в примерах с Л)
-АЛИЛУЙНЫЙ/АЛЛИЛУЙНЫЙ (хотя осталось "аллилуйя")
-АЛИЛУЙЩИК/АЛЛИЛУЙЩИК (хотя осталось "аллилуйя")
-АЛИЛУЙЩИНА/АЛЛИЛУЙЩИНА (хотя осталось "аллилуйя")
-АЛЛОПАТИЧЕСКИЙ (ушло в ст. "аллопатия")
*АЛЛО/АЛО>АЛЛО
-АЛОГИЗМ (!!! "нелогичность" нет и не было)
-АЛОГИЧЕСКИЙ/АЛОГИЧНЫЙ (!!! хотя "нелогичный" осталось в толкованиях)

По словарю Ожегова это первые 370 слов, по словарю Ушакова - первые 451.
Это при том, что 74 слова ушли внутрь статей, так что размер словника практически не изменился!
Орфография изменилась в 28 словах (в том числе бывшие варианты).
Добавлено 119 слов.
Выброшено 102 слова.
Даже боюсь экстраполировать эти цифры на весь словарь!

Rachtyrgin

Цитата: Hellerick от августа 14, 2012, 10:42
Составил список пар слов, которые стоят рядом по алфавиту, находятся в разных словарях, и имеют между собой расстояние Левенштейна равное единице.

Понравилась пара "вздрогнуть=вздротнуть"...
Всякому остановленному фашисту для захвата его в плен можешь еще крикнуть:
«Хэндэ хох!» (Руки вверх!)
«Вафи хинлеги!» (Бросай оружие!)
«Абгезэсен!» (Слезай! — С машины, с лошади, с повозки.)
Если фашист не сразу исполняет твое приказание, крикни грознее и добавь:
«Бай флухтфэрзух вирт гэшози!» (Побежишь — буду стрелять!)
А. Афанасьев. В помощь партизану. Москва, 1942 г.

Awwal12

Цитата: Alone Coder от августа 13, 2012, 08:50
Подкиньте программку под Windows XP, которая сравнит два отсортированных текстовых файла
Вообще, Кодер, вы меня удивляете. Кто тут, собственно, Кодер?.. Задача же элементарно алгоритмизуется и реализуется программно, коль скоро слова в файлах уже отсортированы по алфавиту...
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

I. G.

...И мимимишечных круглышек,
Что безусловно хороши,
Но очень вредны для души.

Rachtyrgin

На самом деле задачка нетривиальная. Корень зла в требовании -Б. Получается, что это и не пересечение множеств и не их разность. Так что "в лоб" не решается. Вероятнее всего, Хеллерик нашел здесь единственно правильный подход, применив приблизительный поиск...
Всякому остановленному фашисту для захвата его в плен можешь еще крикнуть:
«Хэндэ хох!» (Руки вверх!)
«Вафи хинлеги!» (Бросай оружие!)
«Абгезэсен!» (Слезай! — С машины, с лошади, с повозки.)
Если фашист не сразу исполняет твое приказание, крикни грознее и добавь:
«Бай флухтфэрзух вирт гэшози!» (Побежишь — буду стрелять!)
А. Афанасьев. В помощь партизану. Москва, 1942 г.

Тайльнемер


Rachtyrgin

С удовольствием ознакомлюсь с вашим вариантом. Дайте набросок алгоритма в псевдокоде.
Всякому остановленному фашисту для захвата его в плен можешь еще крикнуть:
«Хэндэ хох!» (Руки вверх!)
«Вафи хинлеги!» (Бросай оружие!)
«Абгезэсен!» (Слезай! — С машины, с лошади, с повозки.)
Если фашист не сразу исполняет твое приказание, крикни грознее и добавь:
«Бай флухтфэрзух вирт гэшози!» (Побежишь — буду стрелять!)
А. Афанасьев. В помощь партизану. Москва, 1942 г.

Awwal12

Цитата: Rachtyrgin от августа 16, 2012, 17:11
На самом деле задачка нетривиальная. Корень зла в требовании -Б. Получается, что это и не пересечение множеств и не их разность. Так что "в лоб" не решается.
Боже ж ты мой... :fp:
-Пишем блок, который определяет, идет слово b ДО слова a по алфавиту или после.
-Начинаем параллельное движение по двум файлам. Начинаем, ес-но, с 1-го слова 1-го файла. Начинаем сравнивать со словами 2-го файла с помощью нашего блока. Если слово b идет до слова a, пишем его в целевой файл как +b, переходим к следующему слову 2-го файла. Если слово b совпадает со словом a, переходим к следующему слову 1-го файла и следующему слову 2-го файла. Если слово b идет после слова a, пишем слово а в целевой файл как -а, переходим к следующему слову 1-го файла.
ВСЁ.

P.S.: Ну вы поняли, что сначала оптимальнее определять, совпадает ли пара слов, а уж если не совпадает, тогда мучить их нашим блоком. Это мелочи.
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

Rachtyrgin

А как вы обеспечите синхронность итерации по файлу Ушаков и файлу Ожегов? Количество слов, соответственно, строк в них все-таки разное. И еще, пожалуйста, уточните, в какие сущности вы предполагаете считывать файлы - Set, List, Array?
Всякому остановленному фашисту для захвата его в плен можешь еще крикнуть:
«Хэндэ хох!» (Руки вверх!)
«Вафи хинлеги!» (Бросай оружие!)
«Абгезэсен!» (Слезай! — С машины, с лошади, с повозки.)
Если фашист не сразу исполняет твое приказание, крикни грознее и добавь:
«Бай флухтфэрзух вирт гэшози!» (Побежишь — буду стрелять!)
А. Афанасьев. В помощь партизану. Москва, 1942 г.

Bhudh

Цитата: Rachtyrgin от августа 16, 2012, 19:01в какие сущности вы предполагаете считывать файлы - Set, List, Array?
Сущность File чем не мила? :what:
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Awwal12

Цитата: Rachtyrgin от августа 16, 2012, 19:01
А как вы обеспечите синхронность итерации по файлу Ушаков и файлу Ожегов? Количество слов, соответственно, строк в них все-таки разное.
А зачем оно должно быть одинаковое? :??? Я теряю нить вашей мысли. Еще раз: x - позиция (номер строки) в 1-м файле, y - позиция во 2-м файле, алгоритм обеспечивает параллельное сравнение при минимуме операций. И он почти повторяет то, как вы это сами делали бы ИРЛ.

Для конца файла еще добавьте: при невозможности перейти к следующему a, записываем оставшиеся b как +b (если есть) и завершаем. При невозможности перейти к следующему b, записываем оставшиеся a как -a (если есть) соответственно.
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр