Author Topic: Частотный словарь эсперанто.  (Read 21872 times)

0 Members and 1 Guest are viewing this topic.

Offline lovermann

  • Posts: 890
    • Языковая энциклопедия "Лингвисто"
Quote from: andrewsiak
Эх, Ловерманн, хотел бы я так по-чешски уметь как ты! Завидую! Хотя, с другой стороны, выучу, например, чешский - и куда мне с ним? Разве что на вакации в Прагу... А еще мечтаю выучить сербский (или хорватский) и на те же вакации - в Далмацию...


Вот и я о том же думаю: сербский начну учить, а где его потот тогда использовать? Щас всё тяжко: посвящать изучению языка всего себя, удовлетворять, так сказать, своё желание постигнуть новое, а потом положить знания на полку, откуда они испаряться, -- уже жалко...

Offline Ursego

  • Posts: 168
  • Ветеран броуновского движения
    • Форумы Канады
Предлагаю модератору удалить из ветки всё, что не касается её темы. Идиотский спор закончен. Я не могу спорить, если оппонент повторяет то, что я сказал минутой назад, при этом споря со мной с пеной у рта и опровергая изо всех сил. Я (вроде как эсперантист в этой дискуссии) писал, что не верю в победу эсперанто (относясь к нему лишь как к безобидному хобби), мой удар тут же парируют... тем же:
Quote from: lovermann
Твид и Андрусяк хотя постоянно и пишут о том, что эсперанто никогда не станет тем, чем того хотят эсперантисты
, при этом называя меня непонятливым (ребята, уважайте себя хоть немного - это всё равно как кричать "Я - дурак!").  Я несколько раз писал, что кому Э. не интересно - идите мимо, ребята, не надо мне доказывать то, во что я и так не верю - нет, прицепились как колючки, и обвиняют что мы, эсперантисты, силой затаскиваем в свои ряды. Есть, конечно, и более грубая формулировка вместо "идите мимо, ребята", но мы ж тут под интеллигентов косим, поэтому не пишу - вы ж умные, сами догадаетесь. Станислав Секирин, зачем приводить аргументы тем, кто их в принципе не признаёт? Не хочу сказать ничего плохого про лингвофорум, но есть 3-4 человека, с которыми мне не хочется общаться, заставляя ни в чём не повинного модератора напрягаться и думать что предпринять. Ещё раз предлагаю вытереть всё, связанное с эсперантистами и антиэсперантистами, а можно и всю тему - всё равно выложенные мной словари никому не нужны. Счастливо оставаться!
Ну почему меня всегда перебивают на полусл

Offline RawonaM

  • Posts: 41934
Тема закрыта. Твид, тебе тоже не помешало бы научиться уважительнее относиться к чужим идеям и, вообще, уважительнее обращаться к людям.

Тема разблокирована.

Offline Солохин

  • Posts: 16776
Ещё раз предлагаю вытереть всё, связанное с эсперантистами и антиэсперантистами, а можно и всю тему - всё равно выложенные мной словари никому не нужны. Счастливо оставаться!
Дорогой Ursego!
Видите, если справедливость не наступает в бытии, то она настигает нас в приснобытии. И словарик Ваш мне пригодился - я именно по нему начал учить Эсперанто - и тема Ваша оказалась не напрасной.
Был момент, когда (год назад) я почти слепо верил всему, что мне говорили на Лингвофоруме, и мнение местных "авторитетов" по вопросу об Эсперанто сыграло большую роль.
Я долго не решался даже попробовать выучить язык - что зря силы тратить? - и эта Ваша тема сыграла какую-то роль в том, что я все-таки взялся - и выучил. И увидел, что правы-то оказались Вы, а не Ваши оппоненты.
Спасибо, Медведище!
Sinjoro Jesuo Kristo purigu min.


Вне форума.

Offline Rusiok

  • Posts: 2463
Нужен частотный словарик морфем, хотя бы самых частых (допустим, морфем Эсперанто - мне представляется, для Эсперанто такой словарик составляется легче и должен уже существовать).
"проект предлагал сократить разговорную речь путем сведения многосложных слов к односложным и упразднения глаголов" - Джонатан Свифт. Путешествие в Бальнибири

Offline maqomed1

  • Posts: 334
Это не трудно.

Offline Солохин

  • Posts: 16776
Нужен частотный словарик морфем, хотя бы самых частых (допустим, морфем Эсперанто - мне представляется, для Эсперанто такой словарик составляется легче и должен уже существовать).
http://esperantofre.com/eeo/EoDktA/Morfemo1.htm

Перевод на русский:

http://www.e-novosti.info/forumo/konsultejo/topic5607.html
Sinjoro Jesuo Kristo purigu min.


Вне форума.

Правда, там не совсем морфемы.
Там морфема+окончание, указывающее на её тип.

Если нужны именно морфемы, то просто отбрасывайте окончание -о -а -е -i

 И поглядите там дальше по теме. Там много вариантов этого списка, в разных видах.
Sinjoro Jesuo Kristo purigu min.


Вне форума.

Offline Rusiok

  • Posts: 2463
Спасибо, ваш словарик я уже видел, он не подходит, так как:
Quote
Оставил только корни, так как префиксы и суффиксы Эсперано объясняются в учебниках.
Мне нужен частотный словарик всех морфем.
"проект предлагал сократить разговорную речь путем сведения многосложных слов к односложным и упразднения глаголов" - Джонатан Свифт. Путешествие в Бальнибири

просто отбрасывайте окончание -о -а -е -i
Окончания - тоже морфемы, список должен включать и их.
"проект предлагал сократить разговорную речь путем сведения многосложных слов к односложным и упразднения глаголов" - Джонатан Свифт. Путешествие в Бальнибири

Offline X0r0h

  • Posts: 50
Раз пошла такая пьянка... Хотелось бы видеть частотность буквосочетаний в эсперанто. Дуплетов и триплетов.

Offline Солохин

  • Posts: 16776
А чем плох Златко Тишляр?
Вот же:

o as n j a e mi est la is (10)
ne kaj i vi tio en u tiu ĉu ni
os hav de ke kiu al sed [nomoj] do jes
oni pri bon li tie ili pov por us kio
kun dev far ĉi dir unu iĝ ĝi ankaŭ du (50)

ven vid mal ĉar se sci ebl post ant pli
nun el dek ir vol kiel ali ig tut don
tiel ĉiu ankoraŭ it manĝ iom iu ŝi jam mult
ad hom da jar aŭ afer nur tri et ist
esper in io kongres kvin kiam parol pren antaŭ si (100)

ŝajn ver uj eĉ kie aĵ inter nov tiam kompren
trov ĉe fakt re for cert nom per tag sid
labor laŭ ĉio sufiĉ tre kelk kon land ec grand
ĉiam ĝis ar plu ĝust ej plej tamen dum sur
ul okaz temp tia ekzempl interes ricev tem ha demand (150)

mem sam bezon cent jen foj aŭd german kial rigard
skrib an preskaŭ propon je komision organiz ekster kiom lud
nu simpl aĉet hodiaŭ infan libr pag verk eventual komitat
on pens port problem ŝat divers eg komenc lingv part
person pro at bel grav jugoslav kvar ten ja jun met (200)

mon fin ia il ind konsili rest rilat sub uea
ŝanĝ int kost kred lag last leg lok memor mil
ol ont sinjor trans vend vesper ĝeneral help saŭn tejo
tro estr mank minut ok prezent rajt rapid ses teatr
ekzist ho konsent kultur plen terur tuj ag aper diabl (250)

dis forges mez moment montr opini raport sekv sep amik
dank elekt loĝ nenio pardon scienc sukces atend dom ek
kant kapabl knab las manier mond naŭ sen situaci tiom
traduk vort almenaŭ dezir fort frank funkci grup inform kamp
kia long maten pet punkt salut seri serĉ sol um (300)

amas aranĝ facil hieraŭ ie kapt kontakt man paper program
proksim publik send urb vir am aŭtomobil bedaŭr daŭr ferm
ge karot morgaŭ naci nokt preleg sat svis trink zorg
ĉambr ĵet atent aŭskult edz ekskurs eŭrop famili hor japan
konkret kuir mov nederland pied plan pret respond rimark special (350)

star util aĉ decid dorm finn form fot fru hejm
hotel klar lern membr nepr ord pas pom protokol stult
tra vojaĝ alt bild flank frat ide imag invit iran
klopod kontraŭ kontrol kunikl kur lig normal numer okup ov
plur prez region semajn simul sistem statut supr universitat ĉarm (400)

apart baz cel diskut iam fuŝ krom lev liber nask
neces neniu prepar pur regul reklam rekomend romp simsalabim skatol
spert ĉef ĉeval ŝir adres akcept aparat av aŭtobus bilet
dan difin film franc gratul gvid ital kaz kutim literatur
material neniam patr pend perd perfekt plaĉ popular prezid produkt (450)

rakont rekt river salon signif strat supoz task tranĉ universal
uz vetur viv vizit ĉirkaŭ ŝaf ŝip ĝen afrik akv
amerik anstataŭ aspekt ating banan bibliotek botel dekstr deĵor ekzempler
evolu fak fal flav fraŭl frenez iel kapreol kaŝ koncern
konsist korb kruel kvankam kvazaŭ miks naĝ neŭtral oft orient (500)

paĉj period precip princip pup saĝ simil skandinavi spec sud
suk sved tekst teler tial trakt varm venk veter voj
angl bulgar centr ceter debat er fart feliĉ fiŝ giĉet
inteligent interpret kart kilo kolor komplet komplik koncept konsci konsil
kovr kresk krokodil lanĉ lert leter lit liter map mar (550)

maŝin minimum mir nud ofert okcident paĝ paŝ plor postul
prefer profesi prov renkont rid riĉ sal salt seg seks
sent ski specif super tabl temperatur tim tuk tuŝ uson
valor ŝtel ĵaŭd ĝoj aĝ absolut ajn ampleks amuz anonc
asoci batal bend bird cigared delegaci diskriminaci divid donac eks (600)

entrepren erinac esenc festival firm flor flug fraz grad hebre
instru kar kompetent konkurs konserv konstant korespond kri kuler lav
list lu mark marŝ merkred monat mont nivel oficial ordinar
panj persik plank pokal pont prav preciz premi profesor protest
relativ rus senc siren soci solv sorĉ spinac stat struktur (650)

Или Вам мало 650-ти морфем? Нужна тысяча, или две? или пять?
Sinjoro Jesuo Kristo purigu min.


Вне форума.

Хотелось бы видеть частотность буквосочетаний в эсперанто. Дуплетов и триплетов.
Я никогда не делал этого. Но это ведь нетрудно сделать? Взять любой достаточно длинный текст на Эсперанто и обработать.
Sinjoro Jesuo Kristo purigu min.


Вне форума.

Offline X0r0h

  • Posts: 50
Хотелось бы видеть частотность буквосочетаний в эсперанто. Дуплетов и триплетов.
Я никогда не делал этого. Но это ведь нетрудно сделать? Взять любой достаточно длинный текст на Эсперанто и обработать.
В общем да. Только надо взять много текстов разных авторов из разных стран.

А чем плох Златко Тишляр?
Вот же:

o as n j a e mi est la is (10)
ne kaj i vi tio en u tiu ĉu ni
os hav de ke kiu al sed [nomoj] do jes
oni pri bon li tie ili pov por us kio
kun dev far ĉi dir unu iĝ ĝi ankaŭ du (50)

ven vid mal ĉar se sci ebl post ant pli
nun el dek ir vol kiel ali ig tut don
tiel ĉiu ankoraŭ it manĝ iom iu ŝi jam mult
ad hom da jar aŭ afer nur tri et ist
esper in io kongres kvin kiam parol pren antaŭ si (100)

ŝajn ver uj eĉ kie aĵ inter nov tiam kompren
trov ĉe fakt re for cert nom per tag sid
labor laŭ ĉio sufiĉ tre kelk kon land ec grand
ĉiam ĝis ar plu ĝust ej plej tamen dum sur
ul okaz temp tia ekzempl interes ricev tem ha demand (150)

mem sam bezon cent jen foj aŭd german kial rigard
skrib an preskaŭ propon je komision organiz ekster kiom lud
nu simpl aĉet hodiaŭ infan libr pag verk eventual komitat
on pens port problem ŝat divers eg komenc lingv part
person pro at bel grav jugoslav kvar ten ja jun met (200)

mon fin ia il ind konsili rest rilat sub uea
ŝanĝ int kost kred lag last leg lok memor mil
ol ont sinjor trans vend vesper ĝeneral help saŭn tejo
tro estr mank minut ok prezent rajt rapid ses teatr
ekzist ho konsent kultur plen terur tuj ag aper diabl (250)

dis forges mez moment montr opini raport sekv sep amik
dank elekt loĝ nenio pardon scienc sukces atend dom ek
kant kapabl knab las manier mond naŭ sen situaci tiom
traduk vort almenaŭ dezir fort frank funkci grup inform kamp
kia long maten pet punkt salut seri serĉ sol um (300)

amas aranĝ facil hieraŭ ie kapt kontakt man paper program
proksim publik send urb vir am aŭtomobil bedaŭr daŭr ferm
ge karot morgaŭ naci nokt preleg sat svis trink zorg
ĉambr ĵet atent aŭskult edz ekskurs eŭrop famili hor japan
konkret kuir mov nederland pied plan pret respond rimark special (350)

star util aĉ decid dorm finn form fot fru hejm
hotel klar lern membr nepr ord pas pom protokol stult
tra vojaĝ alt bild flank frat ide imag invit iran
klopod kontraŭ kontrol kunikl kur lig normal numer okup ov
plur prez region semajn simul sistem statut supr universitat ĉarm (400)

apart baz cel diskut iam fuŝ krom lev liber nask
neces neniu prepar pur regul reklam rekomend romp simsalabim skatol
spert ĉef ĉeval ŝir adres akcept aparat av aŭtobus bilet
dan difin film franc gratul gvid ital kaz kutim literatur
material neniam patr pend perd perfekt plaĉ popular prezid produkt (450)

rakont rekt river salon signif strat supoz task tranĉ universal
uz vetur viv vizit ĉirkaŭ ŝaf ŝip ĝen afrik akv
amerik anstataŭ aspekt ating banan bibliotek botel dekstr deĵor ekzempler
evolu fak fal flav fraŭl frenez iel kapreol kaŝ koncern
konsist korb kruel kvankam kvazaŭ miks naĝ neŭtral oft orient (500)

paĉj period precip princip pup saĝ simil skandinavi spec sud
suk sved tekst teler tial trakt varm venk veter voj
angl bulgar centr ceter debat er fart feliĉ fiŝ giĉet
inteligent interpret kart kilo kolor komplet komplik koncept konsci konsil
kovr kresk krokodil lanĉ lert leter lit liter map mar (550)

maŝin minimum mir nud ofert okcident paĝ paŝ plor postul
prefer profesi prov renkont rid riĉ sal salt seg seks
sent ski specif super tabl temperatur tim tuk tuŝ uson
valor ŝtel ĵaŭd ĝoj aĝ absolut ajn ampleks amuz anonc
asoci batal bend bird cigared delegaci diskriminaci divid donac eks (600)

entrepren erinac esenc festival firm flor flug fraz grad hebre
instru kar kompetent konkurs konserv konstant korespond kri kuler lav
list lu mark marŝ merkred monat mont nivel oficial ordinar
panj persik plank pokal pont prav preciz premi profesor protest
relativ rus senc siren soci solv sorĉ spinac stat struktur (650)

Или Вам мало 650-ти морфем? Нужна тысяча, или две? или пять?

Если этот список корректно составлен, то много большего и не надо. Видимо, в эсперанто уже после первой тысячи список будет сильно зависеть от почти случайных факторов. Но конечно, штук 900 было бы не плохо.
Я видел несколько частотных списков, в том числе один приведен в Википедии. Они сильно разнятся.

Offline Rusiok

  • Posts: 2463
Златко Тишляр?
Вот же:
Спасибо, это то, что надо!
"проект предлагал сократить разговорную речь путем сведения многосложных слов к односложным и упразднения глаголов" - Джонатан Свифт. Путешествие в Бальнибири

Offline X0r0h

  • Posts: 50
Кстати, список тишляра показывает, насколько эсперанто естественный. Средняя длина морфем увеличивается с уменьшением частоты.  Имхо, это признак его "натуральности".

Offline maristo

  • Posts: 10027
И закон Ципфа соблюдается.
«Toute discussion theorique est vaine: l'Esperanto fonctionne» Antoine Mеillet

Offline X0r0h

  • Posts: 50
Я Всмотрелся в список тишляра и заметил, что он на каких то специфических текстах составлялся: не могут быть в первой тысяче слова Скандинавия, Иран, Болгария и особенно - дискриминация.

Offline ENS7759

  • Posts: 512
Вот хороший частотный список
http://www.esperantilo.org/eo_frekventeco.txt.gz

Offline Солохин

  • Posts: 16776
он на каких то специфических текстах составлялся
Насколько я помню, это расшифровка звукозаписей разговоров эсперантистов. Естественно, они интересуются, как дела в такой-то стране у собеседника.
То есть, это частотный словарь именно РАЗГОВОРНОГО языка. Не литературного.
Sinjoro Jesuo Kristo purigu min.


Вне форума.

Вот хороший частотный список
http://www.esperantilo.org/eo_frekventeco.txt.gz
Человек просил частотный список МОРФЕМ, а не слов.
Sinjoro Jesuo Kristo purigu min.


Вне форума.

Offline ENS7759

  • Posts: 512
Ну, тогда надо их здесь вылавливать плоть до девятой группы (они  с учетом частотности)
http://www.akademio-de-esperanto.org/aktoj/aktoj2/bro.html

Offline Bhudh

  • Posts: 47786
  • aka 蝎
    • Сайты по языкознанию
надо их здесь вылавливать плоть
Это что ещё за людоедские замашки?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

 

With Quick-Reply you can write a post when viewing a topic without loading a new page. You can still use bulletin board code and smileys as you would in a normal post.

Note: this post will not display until it's been approved by a moderator.
Name: Email:
Verification:
Type the letters shown in the picture
Listen to the letters / Request another image
Type the letters shown in the picture:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: