Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Алгоритм поиска общих частей строк

Автор myst, апреля 14, 2009, 19:59

0 Пользователи и 1 гость просматривают эту тему.

Ömer

ya herro, ya merro

myst

У меня почему-то
Цитировать
./parts-freq2  0.01s user 0.01s system 0% cpu 5.119 total
Хотя процессор 1,6 ГГц, второй прогон... :???

Алексей Гринь

Цитата: "myst" от
Цитировать# 3.0 was released on 19 November 2007 as part of .NET Framework 3.5.
Ы?
и чо?
я отдельно где-то качал и быдлокодил на C#3 под .NET 2.0 и VS2005
а может я фантазирую, но в любом случае ничто не мешает дружбе C#3 и .NET 2.0 (Linq тока добавить), ибо технически .NET 2.0 = .NET 3.0 = .NET 3.5 плюс в C#3 добавлен один лишь синтактический сахар
肏! Τίς πέπορδε;

Ömer

ЦитироватьХотя процессор 1,6 ГГц, второй прогон... :???

Я обращал внимание, что там половина времени - сортировка для вывода
(сортирую по длине подстроки, с одинаковой длиной - по частотности, а с одинаковой частотностью  - в алфавитном порядке)
ya herro, ya merro

myst

Цитата: "Алексей Гринь" от
я отдельно где-то качал и быдлокодил на C#3 под .NET 2.0 и VS2005
Хде? Я тожа хочю. :)

myst

Цитата: "svarog" от
Я обращал внимание, что там половина времени - сортировка для вывода
Так Ваши данные без сортировки были?

У меня без сортировки 2,56 сек.

Алексей Гринь

肏! Τίς πέπορδε;

Ömer

Цитата: myst от апреля 17, 2009, 14:17
Так Ваши данные без сортировки были?

У меня без сортировки 2,56 сек.

Т.е. остальные 50 сек занимала сортировка?  :o

Я там сообщения на консоль вывожу: когда начинается чтение из файла, когда складывание в хеш-таблицу, и когда полученная хеш-таблица сортируется для вывода результата. Всё вместе секунд 5-6 занимает.
ya herro, ya merro

myst

Цитата: "svarog" от
Т.е. остальные 50 сек занимала сортировка?  :o
;D Да я про Ваш код, про Ваш.

myst

У Вас в выхлопе нет однократно встречаемых сочетаний. А их там (по моей программе) 234 682.

Ömer

А, да-да, мои данные были без сортировки. И секунды оценивались "на глазок" (чем вы их кстати меряете?)

ЦитироватьУ Вас в выхлопе нет однократно встречаемых сочетаний.
нету... потому что там стоит if (de.Value > 1), если убрать if - то будут.
ya herro, ya merro

Ömer

btw я так понял, в вашем файле words.num вторым значением идёт частотность слова в тексте, и на неё ещё нужно умножить?
ya herro, ya merro


myst

Цитата: "svarog" от
нету... потому что там стоит if (de.Value > 1), если убрать if - то будут.
Это не сильно повлияло: 2,957 сек. :)

Мда, CLISP педальный. Будем ждать, когда прикрутят JIT. :)

Ömer

ya herro, ya merro

myst

Цитата: "svarog" от
Вот, прикрутил ещё учёт частотности слова (из файла words.num)
У меня исключение вылетает: ошибка преобразования строки в вещественное число. Десятичная точка ему нелюба?

Ömer

Думаю да.
у вас наверно русская локаль по умолчанию, с разделитем-запятой.

Исправил код чтобы учитывалась точка:
http://pastebin.com/m65bc53d3
ya herro, ya merro

myst

Цитата: "svarog" от
Исправил код чтобы учитывалась точка:
http://pastebin.com/m65bc53d3

Цитироватьparts-freq3.cs(25,71): error CS0103: The name 'NumberStyles' does not exist in the current context
:???

Ömer

Я ещё добавил вверху using System.Globalization; :)
Но не подсветил эту строчку.
ya herro, ya merro

Ömer

Кстати, можно задать остальным лингвофорумчанам загадку: какое двух- и трёх- буквенное сочетание наиболее частое в русском языке (на основе вашего текста).

Про то, что самая частая буква это "о" - наверно все знают. (Она и на русской клавиатурной раскладке, сделанной по частотному принципу, как раз в серединке) :)
ya herro, ya merro

myst

Цитата: "svarog" от
Я ещё добавил вверху using System.Globalization; :)
Ага, исправил. Оттранслировалось, но исключение всё равно вылетает. :what:

myst

Цитата: "svarog" от
(Она и на русской клавиатурной раскладке, сделанной по частотному принципу, как раз в серединке)
Кстати, на основе этих данных можно сочинить более оптимальную раскладку. :)

Ömer

Цитата: myst от апреля 17, 2009, 15:19
Ага, исправил. Оттранслировалось, но исключение всё равно вылетает.

Ыыы не силён я в глобализации. :what:
ya herro, ya merro

myst

Цитата: "svarog" от
Ыыы не силён я в глобализации.
Может, проще локаль в программе выставить?

Ömer

ya herro, ya merro

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр