Каким-то образом возможно вынут все свои сообщения отсюда (http://lingvoforum.net/index.php?action=profile;area=showposts;sa=messages) в один текстовый файл? :??? Хочу провести стат. анализ своей речи. :umnik:
Написать простенькую программу на каком-нибудь языке программирования.
Я могу попробовать.
Вот, пожалуйста.
Запускаете LFUserCorpus.exe без аргументов, вводите id пользователя, ждёте, получаете текстовый файл с текстом всех сообщений без цитат.
Либо даёте id в качестве аргумента. Второй аргумент — путь выходного файла (опционально).
(Id пользователя можно посмотреть в адресной строке, зайдя в профиль пользователя. Напр.,
httр://lingvoforum.net/index.php?action=profile;area=summary;u=40968.
40968 — это id.)
Если что-то работает не так, или нужно что-то ещё — говорите, я переделаю.
Вот ваш корпус.
Извините, там перевод строки пропадает. Щас я переделаю.
А можно посмотреть некомпилированный код? Просто интересно посмотреть вы это делаете.
Лично я бы решил задачу с помощью Экселя, downloadthemall'а, и SED'а.
Цитата: Тайльнемер от июня 8, 2013, 10:22
Извините, там перевод строки пропадает.
Исправил
Цитата: Hellerick от июня 8, 2013, 11:00
А можно посмотреть некомпилированный код? Просто интересно посмотреть вы это делаете.
По-тупому. Вот исходник.
Цитата: Hellerick от июня 8, 2013, 11:00
Лично я бы решил задачу с помощью Экселя, downloadthemall'а, и SED'а.
А Эксель для чего?
Цитата: Тайльнемер от июня 8, 2013, 11:11
А Эксель для чего?
Я бы в нем сгенерировал html-код странички со ссылками, которые бы скормил downloadthemall'у.
Замечание:
Прога читает ЛФ от имени пользователя bot, которого я создал. Я вступил им во все открытые группы и подал заявки во все закрытые группы, но эти заявки ещё рассматриваются. Так что сообщения в закрытых группах пока не видны.
*Хеллерик разглядывает таймстампы в архиве*
Тайльнемер, а вы сейчас в каком часовом поясе?
UTC+7
А чё там с таймстампами?
Цитата: Hellerick от июня 8, 2013, 11:00Лично я бы решил задачу с помощью Экселя, downloadthemall'а, и SED'а.
А я бы с помощью PHPQuery+jQuery.
В принципе, там одного wget'a c sed'ом должно хватить.
Тайльнемер, у Вас аватар пропал.
Цитата: Тайльнемер от июня 8, 2013, 11:17
Прога читает ЛФ от имени пользователя bot, которого я создал.
А как он соединяется/логинится с ЛФ?
Цитата: Rwseg от июня 8, 2013, 02:09
Корпус своих сообщений
Corpus īnscriptiōnum suārum... ;D
ЦитироватьConsole.OutputEncoding = Encoding.UTF8;
Это было очень не в тему. У меня кракозябры шли, пока это не убрал :(
А так, штука очень даже. Правда, зачем, конечно, так всё сложно было делать? Но ок, довольствуемся-с.
Цитата: Rwseg от июня 12, 2013, 00:32
А как он соединяется/логинится с ЛФ?
С помощью кукизов.
Цитата: Bienna от июня 12, 2013, 01:01
Это было очень не в тему. У меня кракозябры шли, пока это не убрал
А, я понял — у вас растровый шрифт в консоли.
Я всегда ставлю Consolas, поэтому даже не знал, что есть такая проблема.
Цитата: Bienna от июня 12, 2013, 01:01
Правда, зачем, конечно, так всё сложно было делать?
Я не догадался, как сделать проще.
Как бы вы сделали?
А чё, тупым windows sriptом никто для таких целей не пользуется?
Цитата: Тайльнемер от июня 12, 2013, 04:19
А, я понял — у вас растровый шрифт в консоли.
Ну, такое у всех, подразумеваю, по умолчанию, посему таки лучше было б убрать эту строчку :)
А вообще, виндосовской cmd'шкой я пользуюсь раз в сто лет, поэтому..)
Цитата: Тайльнемер от июня 12, 2013, 04:19
Как бы вы сделали?
Я чуть попозже напишу. Сейчас я всю неделю буду в дипломе, скоро защита.
Цитата: Bienna от июня 12, 2013, 14:03
Ну, такое у всех, подразумеваю, по умолчанию, посему таки лучше было б убрать эту строчку :)
Плохой совет. Лучше в таком случае сделать ещё один ключ командной строки.