Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Alpha Reloaded

Автор Алексей Гринь, января 9, 2011, 16:24

0 Пользователи и 1 гость просматривают эту тему.

myst

Цитата: Алексей Гринь от января  9, 2011, 17:33
А по сути, нафиг оно нужно на первых порах. Можно и просто искать так, как есть.
Вы меня путаете.
Ну ты же собрался комбайн делать. Ведь инфлектор можно и как справочник юзать.

myst

Цитата: Алексей Гринь от января  9, 2011, 17:38
Идите нафиг, пошёл писать морфологию для существительных :) Посмотрим, что выйдет.
А то я тут нашёл одну либу, так она например игнорирует акценты... Бред.
Так бы сразу и признался, что на велосипеды потянуло. ;)

Алексей Гринь

Если бы это был велосипед, я бы уже что-то в сети нашёл.

К тому же, не в велосипедостроении дело. Если даже либа и есть, то у ней обязательно будут какие-то проблемы. Или она не в юникоде, а в каком-то странном шрифте и кодировки; или она игнорирует ударение; или у ней есть только существительные, а глаголы не доделаны и т.п. Я вот поискал немного и толлько такое нашёл.
肏! Τίς πέπορδε;

myst

Цитата: Алексей Гринь от января  9, 2011, 17:44
Если бы это был велосипед, я бы уже что-то в сети нашёл.
Я по русской морфологии заколебался искать, а ты говоришь: «Сразу».

Алексей Гринь

Если ты русскую морфологию заколебался искать, то греческой и подавна нет.
肏! Τίς πέπορδε;

myst

А ты по моей ссылке ходил? Там вроде есть морфология.

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

myst


Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

myst

Цитата: Bhudh от января  9, 2011, 18:22
А-а-а! Там расширение .koi! :uzhos:
Это не то, что ты подумал.
Чой-то оно не особо быстрое, мяхка оворя. :(

myst

Фи, её пропустили через обфускатор. Фтопку! Хотя базу данных можно и упереть.

Bhudh

Цитата: mystЧой-то оно не особо быстрое, мяхка оворя.
Даже у тебя⁈ Тормознутое, да...
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Bhudh

Цитата: mystФи, её пропустили через обфускатор.
Вообще, почему эта шара себя фрёй именует? Обнаглели совсем.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Алексей Гринь

Запрототипил определение типа ударения (периспоменон, оксютонон и т.п.) Пока на сегодня хватит :)
肏! Τίς πέπορδε;

Demetrius

Как там успехи?

Кстати, кроме Lucene вроде есть Sphinx. Подробностей не вем.

Алексей Гринь

Короче, энтузиазма много, а сил и времени немного, поэтому Alpha Reloaded трансформируется в вики-проект «Древнегреческий язык». В данный момент я занимаюсь переливкой словаря Дворецкого в вики-формат.

Посмотрите тут: http://lingvowiki.info/w/Словарь_древнегреческого_языка

Посмотрите разметку, что можно изменить (пока я не залил все 141 части), есть ли ошибки конвертации.

И ещё некоторые замечания.

Во-первых, мне не нравится бхудхов шрифт в шаблоне lang-gr2 (палатино линотайп у меня выбирается, вроде), т.к. какой-то он плохо читаемый, если текста много. Особенно это видно, если заголовки статей тоже используют этот шрифт, получается ещё нечитаемее. Сам я привык к Lucida Sans Unicode или Arial Unicode MS. Давайте поменяем там приоритеты в списке.

Во-вторых, я сделал шаблон для заголовочных слов статей, называется он Шаблон:ДГ. Пока это рыба, но надеюсь потом можно будет найти для него применение (для какой-то индексации, может быть).
肏! Τίς πέπορδε;

Bhudh

Сразу несколько вопросов.
Уже заведена директория Словарь/ (см. тестовые Словарь/zh/子 и Словарь/ukr/лайно), почему не сделать Словарь/grc/слово для каждого слова? Муторно, понимаю, но не обязательно ж сразу⁈ (И, кстати, может, ты можешь написать бота под это дело?)
Второй: а чего это у заглавных букв диакритика не комбинированная? Ошибка конвертации? Кстати, откуда? Из Лингво, что ли? Я бы копипастил из Альфы... Там с этим порядок.
Далее... Так ли в заглавном слове нужны долготы над α ι υ? Может, вынести их в скобки, как в Альфе с диакритизированными сделано?
Далее. Что делать с глоссами Гесѵхия? Отдельной папкой в Источники или можно как-то в Словарь/grc?
Окромя Гесѵхия и ещё разные источники глосс есть. Вон, читаю Тронского, он приводит заимствования из сикульского, сунулся в Дворецкого — ан шиш!

Offtop
Цитата: Алексей Гриньмне не нравится бхудхов шрифт в шаблоне lang-gr2
Ну что поделать, не терплю я санс-серифа в эллинице...
А в латинице и кириллице наоборот.
Может, в lang-gr{2} класс всунуть и в личных стилях вид менять? (Отдельным параметром слишком муторно получится.)
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Алексей Гринь

Цитата: Bhudh от февраля 25, 2011, 20:28
Муторно, понимаю, но не обязательно ж сразу⁈
Никто этим заниматься не будет, как главный энтузиаст говорю.

Цитата: Bhudh от февраля 25, 2011, 20:28
(И, кстати, может, ты можешь написать бота под это дело?)
Я вообще не знаю, как в вики устроены боты.

Цитата: Bhudh от февраля 25, 2011, 20:28
Второй: а чего это у заглавных букв диакритика не комбинированная?
Это так важно?

Цитата: Bhudh от февраля 25, 2011, 20:28
Ошибка конвертации? Кстати, откуда? Из Лингво, что ли?
Да хз, на диске валялся html-документ — то ли сам из Альфы конвертнул, то ли скачал, не помню. С помощью скриптика перевёл html в wiki (в принципе wiki-движок понимал html-представление и без изменений, но wiki-разметка занимает меньше места, плюс добавил шаблон {{gr2|}} для греч. текста (уменьшенная версия от {{lang-gr2}}, чтобы меньше места занимало)).

В оригинальном документе все греческие буквы были представлены в виде &#XXX; я их схлопнул в нормальное представление, о комбинации как-то не подумал.

Цитата: Bhudh от февраля 25, 2011, 20:28
Так ли в заглавном слове нужны долготы над α ι υ?
Например? Дай пример из существующей статьи на вики.

Цитата: Bhudh от февраля 25, 2011, 20:28
Может, вынести их в скобки, как в Альфе с диакритизированными сделано?
Можно, но я уже залил 43 страницы, поэтому только с помощью бота в Википедии in place, но я их не умею, как уже сказал.

Цитата: Bhudh от февраля 25, 2011, 20:28
Что делать с глоссами Гесѵхия? Отдельной папкой в Источники или можно как-то в Словарь/grc?
Я только на полпути сообразил, что лучше бы уточнить, т.е. назвать «Древнегреческо-русский словарь»... Или всё переименовать, чтобы не было недопонимания, или оставить как название подпроекта, а не имя конкретной реалии. Ведь Гесихий это вроде «Толковый словарь древнегреческого», получается.
В принципе если Гесихий не добавляет ничего нового, то в общий словарь незачем впихивать. Избыточно. Если же добавляет какое-то новое значение, то можно дописать.
А так, как сочинение вообще, лучше параллельно от греч.-рус. словника иметь.

Цитата: Bhudh от февраля 25, 2011, 20:28
Окромя Гесѵхия и ещё разные источники глосс есть. Вон, читаю Тронского, он приводит заимствования из сикульского, сунулся в Дворецкого — ан шиш!
То же самое — если в Дворецком нет, то можно смело добавлять, главное чтобы внешним видом было так же, а также бы правильно сделать специальную помету, что это supplementum, в онлайн-Liddel-Scott есть спецзначок типа крестика, посмотри.

Цитата: Bhudh от февраля 25, 2011, 20:28
Может, в lang-gr{2} класс всунуть и в личных стилях вид менять? (Отдельным параметром слишком муторно получится.)
ЛУчше не надо. Т.к. есть анонимы без стилей.

Цитата: Bhudh от февраля 25, 2011, 20:28
Ну что поделать, не терплю я санс-серифа в эллинице...
НУ реально палатино плохо читаем... Буквы слишком округлые и я вижу одни круги вместо букв. Хотя может это дело привычки.
Я в словаре проставил Arial Unicode MS. У него нет проблем с показом? А то Lucida Sans Unicode почему-то в википедии не отображал диакритику у меня, хотя на ЛФ всё ок. В эт их веб-делах не очень смыслю.
肏! Τίς πέπορδε;

Bhudh

Цитата: Алексей ГриньЯ вообще не знаю, как в вики устроены боты.
(wiki/ru) Википедия:Бот
Там и под .NET вроде есть подвижки.

Цитата: Алексей ГриньЭто так важно?
Да просто нелогично: у строчных комбайн, а у прописных декомпоз...

Цитата: Алексей ГриньДай пример из существующей статьи на вики.
Цитата: http://wiki.lingvoforum.net/w/Словарь_древнегреческого_языка/8ἀμφι-λᾰχαίνω
Цитата: http://wiki.lingvoforum.net/w/Словарь_древнегреческого_языка/20ἀστῠ-βοώτης
Цитата: http://wiki.lingvoforum.net/w/Словарь_древнегреческого_языка/27γρᾱΐδιον
Страницы открыл наобум.
Последний особенно впечатляет.

Цитата: Алексей Гриньесли в Дворецком нет, то можно смело добавлять
А сейчас-то куда добавлять? Страницы-то нумерованные, а не по алфавиту...
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Алексей Гринь

Цитата: Bhudh от февраля 25, 2011, 23:46
ЦитироватьЯ вообще не знаю, как в вики устроены боты.
(wiki/ru) Википедия:Бот
Там и под .NET вроде есть подвижки.
ОК, посмотрю.
Ура, оставшиеся 90 страниц можно залить ботом :)

Цитата: Bhudh от февраля 25, 2011, 23:46
Страницы открыл наобум.
Последний особенно впечатляет
В моей версии альфы так же.

Цитата: Bhudh от февраля 25, 2011, 23:46
ЦитироватьЭто так важно?
Да просто нелогично: у строчных комбайн, а у прописных декомпоз...
Логично-нелогично, но это важно только для ботов, для людей пофиг.

Цитата: Bhudh от февраля 25, 2011, 23:46
А сейчас-то куда добавлять? Страницы-то нумерованные, а не по алфавиту...
Эм...

Заходишь на http://lingvowiki.info/w/Словарь_древнегреческого_языка , выбираешь в содержании локацию слова, переходишь на нужную страницу, редактируешь. В чём проблема? Одну большую статью на целую букву я не могу делать, сервер пишет allocation failed, не осиливает. Щас, пока я не всё долил, выше буквы эпсилон не сможешь добавлять, c'est la vie.
肏! Τίς πέπορδε;

Алексей Гринь

Если страница расползается слишком большой (около 350-400 кб), то подход как в бэйсике: напр., если у текущей страницы номер 121, то создаём новую страницу под числом: 121.0, и аккуратно впихиваем в категоризатор ссылку на неё между номерами 121 и 122. Потом если опять не влезет, то создаём 121.1, 121.2 и т.д.

По алфавиту не могу делать, так как словарь расширяющийся и тогда бы пришлось постоянно страницы переименовывать и всяко-разно тупить...

А тут ещё для бота сказка получается: он может пройтись по всему словарю, просто итерируя по числам.
肏! Τίς πέπορδε;

Bhudh

А Α.001‥Α.002‥Α.122...Ω.024 кто мешает сделать?

Да, ещё... Может, сокращения авторов с латинских на русские заменить?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Алексей Гринь

Цитата: Bhudh от февраля 26, 2011, 12:00
А Α.001‥Α.002‥Α.122...Ω.024 кто мешает сделать?
Никто не мешает, но так неудобно мне.

Цитата: Bhudh от февраля 26, 2011, 12:00
Да, ещё... Может, сокращения авторов с латинских на русские заменить?
Не пойдёт. Там лат. представление вставлено, чтобы отличать русский текст от имени, ср. текущее:

Цитироватьκρᾰνο-ποιός ὁ мастер шлемов или доспехов Arph.

А будет как?

Цитироватьκρᾰνο-ποιός ὁ мастер шлемов или доспехов Арф.

Шлемов, доспехов и арф. ОК.
肏! Τίς πέπορδε;

Bhudh

У программной альфы стили. Курсив и цвет рулят. А в вики можно ещё и шрифт. И скобки.

И разве Аристофан по-русски так сокращается?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Bhudh

О бот разошёлся!

А потом будет с этими страничками мучаться, SMW выставлять, стили, долготы убирать...

Кстати, шаблон оглавления надо будет сделать.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр