Что-то я не видел определённой конкретики/математики, когда этимологи рассуждают о смысловых сдвигах. Хотелось бы иметь некий конкретный пробабилистический реестр, you know what i'm sayin. Т.е. например чётко регистрировать частотность определённых переходов с конкретными цифрами, категоризировать все понятия по каким-то специальным семантическим группам, с пробабилистическими взаимотношениями и т.д., также по времени расхождения. И в каждом этимологическом словаре не просто писать "сосать" > "женщина", но и приводить целый набор цифр в доказательство, а не только три с половиной параллели в других языках, т.к. ценность таких параллелей может оказаться несущественной.
Цитата: Алексей Гринь от августа 28, 2012, 00:55чётко регистрировать частотность определённых переходов с конкретными цифрами, категоризировать все понятия по каким-то специальным семантическим группам
Поверить алгеброй гармонию?
:eat:
Гринь, (http://lingvowiki.info/wiki/images/1/15/Sm_thumbsup.svg) Отличная идея!
Сколько людей на улицу! Семантические фантазии - это ж их хлеб! :)
Для начала можно поработать с сужением/расширением значений. Сужение, как известно, реже. Если взять статистику хотя бы по Сводешу, где шире, где уже, уже можно что-то посчитать.
Цитата: Алексей Гринь от августа 28, 2012, 00:55
Что-то я не видел определённой конкретики/математики, когда этимологи рассуждают о смысловых сдвигах.
Ее нет. Отсутствие таковой - общее место в любом рассуждении о теории этимологических исследований.
Цитата: Алексей Гринь от августа 28, 2012, 00:55
Т.е. например чётко регистрировать частотность определённых переходов с конкретными цифрами, категоризировать все понятия по каким-то специальным семантическим группам, с пробабилистическими взаимотношениями и т.д., также по времени расхождения.
Семантические сдвиги с трудом поддаются формализации.
Цитата: Алексей Гринь от августа 28, 2012, 00:55
не только три с половиной параллели в других языках, т.к. ценность таких параллелей может оказаться несущественной.
Метод семантических параллелей пока что ведущий.
О проекте каталога семантических переходов писала Анна А. Зализняк: http://www.philology.ru/linguistics1/zaliznyak_anna-01.htm
Цитата: Alone Coder от августа 28, 2012, 07:24
Сколько людей на улицу! Семантические фантазии - это ж их хлеб! :)
Для начала можно поработать с сужением/расширением значений. Сужение, как известно, реже. Если взять статистику хотя бы по Сводешу, где шире, где уже, уже можно что-то посчитать.
В связи с новой политикой партии и правительства: без комментариев.
Цитата: Алексей Гринь от августа 28, 2012, 00:55
Что-то я не видел определённой конкретики/математики, когда этимологи рассуждают о смысловых сдвигах.
Это какбэ не бухгалтерия. В простых целых числах не выражается, да.
Цитата: autolyk от августа 31, 2012, 00:32
В простых целых числах не выражается, да.
А простые целые и не надо.
Цитата: I. G. от августа 31, 2012, 15:07
Цитата: Алексей Гринь от августа 31, 2012, 15:07Математикой можно описать всё.
Наивно.
Утютю. Простой арифметикой, известной филолухам, два плюс два - нельзя. А вот... если собственную модель ввести, то можно хорошенько формализовать. Нужно больше трудиться и меньше в филолухо-герменевтических облаках витать.
Цитата: I. G. от августа 31, 2012, 00:28
О проекте каталога семантических переходов писала Анна А. Зализняк: http://www.philology.ru/linguistics1/zaliznyak_anna-01.htm
Насчёт калькирования. Что если между каждыми двумя языками, имеющими в свои периоды исторически установленные контакты, установить «индекс взаимного общения» на базе явных и очевидных заимствований: фр.-нем. crétin/Kretin > рус. кретин, и так далее, всех их старательно посчитать. Затем каждая семантическая деривационная пара между двумя такими языками будет weighted (как сказать по-русски?) по индексу соседства, зависеть от него (чем меньше языки общались, тем менее вероятность калькирования в конкретном сравнении). Я, правда не уверен, есть ли корреляция между калькированием и простым заимствованием, надо проверить (но интуитивно должна быть).
Идея в том, что бы использовать некую вероятностную модель, а не прямо уж заменить всё числами. Напр. при старой системе, составитель этимологического словаря Дебилкин высосал из пальца этимологию X и поместил в свой словарь. Этимолог Олигофренко, составляя этимологический словарь для другого языка, почитав словарь Дебилкина, привёл в пример его высосанное из пальца сравнение в подтверждение этимологии Y. На сцену выходит этимолог фон Даун, который идёт в местную библиотеку, видит аж две паралелли в двух разных языках и, писаясь от счастия, старательно вписывает ссылки в своё гнездо (в оригинале написано "возможно" - но кому какое дело до этого, правда? wishful thinking никто не отменял - в какой-то из ссылок "возможно" возьмёт да отвалится, оно ведь не строго обязательно, субъективная оценка). Если бы у каждой этимологии был некий обязательный вероятностный индекс (относительно некоего идеала), то такого бы не случалось. И не имея чётко формализированной модели, мы даже не можем оценить, сколько вот таких вот ложных испорченно-телефонно-циклических ссылок мы имеем сейчас.
Цитата: Алексей Гринь от августа 31, 2012, 15:46
А вот... если собственную модель ввести, то можно хорошенько формализовать.
Цитата: I. G. от августа 31, 2012, 00:28
Семантические сдвиги с трудом поддаются формализации.
Не такие дураки решали эту проблему.
Цитата: Алексей Гринь от августа 31, 2012, 15:46фр.-нем. crétin/Kretin > рус. кретин, и так далее
Оригинал французского ой как сложно будет вычислить...
Цитата: Алексей Гринь от августа 31, 2012, 15:46
Если бы у каждой этимологии был некий вероятностный индекс (относительно некоего идеала), то такого бы не случалось.
Откуда возьмется идеал?
Алексей Гринь всё правильно говорит. Думайте.
Цитата: Alone Coder от августа 31, 2012, 15:50
Алексей Гринь всё правильно говорит. Думайте.
Фейспальмы запрещены.
Цитата: I. G. от августа 31, 2012, 15:47
Не такие дураки решали эту проблему.
В том-то и дело, что дураки. По ссылке конкретики особой не нашёл, одна жиденькая герменевтика.
Если кроме как взвываний к авторитету нечего сказать, лучше не замусоривайте тред. А за ссылку спасибо.
Цитата: Алексей Гринь от августа 31, 2012, 15:51
Цитата: I. G. от августа 31, 2012, 15:47
Не такие дураки решали эту проблему.
В том-то и дело, что дураки. По ссылке конкретики особой не нашёл, одна жиденькая герменевтика.
Если кроме как взвываний к авторитету нечего сказать, лучше не замусоривайте тред. А за ссылку спасибо.
При чем тут взывание к авторитету?
Я много чего смотрела по семантическим переходам. И проблема тут не в том, что авторы, решавшие эту сложную теоретическую задачу, были не программистами, а в особенностях семантики.
Неплохо бы еще ознакомиться с монографией Толстой по семантике. Вот где кладезь примеров переходов, вряд ли сводимых к "идеалу".
Цитата: I. G. от августа 31, 2012, 15:48
Цитата: Алексей Гринь от августа 31, 2012, 15:46Если бы у каждой этимологии был некий вероятностный индекс (относительно некоего идеала), то такого бы не случалось.
Откуда возьмется идеал?
Когда переход значения и эволюция слова чётко засвидетельствованы в исторических, фактических источниках. Это будет идеал, 100.
А вот когда уже идёт этимологизирование бесписьменных, разговорных состояний языка, то там идеала быть не может. Может быть только значение, относительное к идеалу: 20, 40 и т.д.
Цитата: I. G. от августа 31, 2012, 15:54
Вот где кладезь примеров переходов, вряд ли сводимых к "идеалу".
Приведите пример. Я ведь говорю только о вероятностной модели. Под идеалом я только предлагал что понимать под верхней планкой индекса. Я не призываю всё «сводить к некоему идеалу». Тут только вопрос расчёта вероятности перехода. Более вероятно, менее вероятно, и т.д. Fuzzy logic. А современная логика у филолухов чисто интуитивная, прямиком из Средних Веков: "я как-то вот так считаю, что наверное..."
Христианин к кретину и гражданин к идиоту большое отношение имеют?
А ведь семантика переходов схожая!
Цитата: I. G. от августа 31, 2012, 15:54
а в особенностях семантики.
При огромном потоке данных всё самой собой выправится, даже если мы установим немного неправильные изначальные понятия. Тут нечто схожее с массовым сравнением Гринберга: для филолухов звучит страшно, но слепая статистика тем не менее выдаёт
приблизительно верные результаты (даже если где-то втесались заимствования). А так как у нас здесь заведомо
нечёткая логика (а не строгое "входит-не входит" как в языковой классификации), то эта приблизительность — совсем не проблема.
А где ты возьмёшь «огромный поток данных»? У гугла?
Цитата: Алексей Гринь от августа 31, 2012, 16:18
Цитата: I. G. от августа 31, 2012, 15:54
а в особенностях семантики.
При огромном потоке данных всё самой собой выправится, даже если мы установим немного неправильные изначальные понятия. Тут нечто схожее с массовым сравнением Гринберга: для филолухов звучит страшно, но слепая статистика тем не менее выдаёт приблизительно верные результаты (даже если где-то втесались заимствования). А так как у нас здесь заведомо нечёткая логика (а не строгое "входит-не входит" как в языковой классификации), то эта приблизительность — совсем не проблема.
Вы не понимаете сути.
Цитата: I. G. от августа 31, 2012, 16:25
Вы не понимаете сути.
У вас отсутствует понимание.
Цитата: Bhudh от августа 31, 2012, 16:22
А где ты возьмёшь «огромный поток данных»? У гугла?
Странный вопрос. А где этимологи их берут? Из попы достают? Два варианта:
1) Использовать существующие этимологические словари на предмет «идеалов», главное условие — строгая засвидетельствованность. Напр., если в древнерусских и русских письменных источниках есть рефлексы одного и того же слова, при этом в древнерусском значение выводится уверенно (контекст, билингва и т.д.) - то оно засчитывается как идеал. В таком случае все не-идеалы (семантические дивергенционные пары) будут опираться впоследствии на него. Не-идеалами будут, в основном, семантические сдвиги в реконструируемых стадиях языка, для которых нет строгого свидетельства.
2) Идеалистический вариант: совершить «революцию» и перестать ковырять в носу, т.е. начать потихоньку составлять специализированные словари с нуля. Где данные берутся, я уже указал выше.
Оцифровывать вручную будешь? :eat:
Цитата: Bhudh от августа 31, 2012, 16:40
Оцифровывать вручную будешь? :eat:
«Мне ленно, следовательно идея Гриня ошибочна»?
Tu scribas.
Можно для начала базу из старлинга.
Цитата: I. G. от августа 31, 2012, 15:48
Откуда возьмется идеал?
+
Идея Алексея Гриня неверна потому, что сделана из ложной предпосылки : "существует-мол (или возможен) язык (конланг) из конечного числа слов, каждое из которых имеет одно и только одно значение". На самом деле, лингвисты ещё в школе учат, что элементарных смыслов не существует. Язык - это система оппозиций, сопоставлений, противопоставлений, а не система атомов, из сочетаний которых... Смысл вычленяется так: в одной ситуации говорим так, в другой - иначе (включая ситуации говорения на разных языках) - тогда слово в одной ситуации имеет один смысл, а в другой ситуации - другой. Предметная область ситуаций, вообще говоря, имеет размерность "бесконечность в квадрате". Так что...
Вы не поняли идею Алексея Гриня. Семантическое поле слов соответствует возможным контекстам и расширяется, сужается и перемещается постепенно, а не как хочется господам этимолухам ("моча=кислый=сырой", "подмышка=нога=тело" - примеры из Гамкрелидзе-Иванова). Примеры из зафиксированных языков МОЖНО собрать, их МОЖНО обработать и результаты МОЖНО использовать для проверки вековых напластований фантазий. Это будет смерть для этимолухов, поэтому они всеми силами будут дискредитировать научный метод.
Вот цитата как раз в тему:
Цитировать"Дело в том, что слово, превращенное исследователем в предмет семантического анализа, становится изолированным сгустком смысла, словом in vitro, то есть конструктом со своим модусом существования. Слово как предмет семантического анализа - реальность нашей исследовательской практики, а не то слово, с которым мы имеем дело in vivo. Ведь это мы поместили его в лабораторный контекст семантики, т.е. пpепаpиpовали, дабы затем до- и пpи- мыслить все допустимые для этого слова правильные контексты <...> In vivo говоpящий никогда не имеет дела со смыслом слова во всем объеме, но лишь со смыслом, реализованным в локальном контексте. То же, вообще говоря, веpно для смысла фразы.
Но что из этого следует? Получается, что в определенном отношении фраза не состоит из слов, а текст не состоит из фраз".
Р.М.Фрумкина. Самосознание лингвистики - вчера и завтра. Изв.АН - Серия литературы и языка, т.58, 1999, # 4
Претензии основаны на упорном нежелании понимать. Совершенно необязательно сидеть и расчленять значения на «атомы». Достаточно, например, особо ничего не придумывая, просто каталогизировать уже все имеющие в этимологических словарях семантические сдвиги (но только чётко засвидетельствованные в исторических (письменных) источниках, которые мы назвали «идеальными»). Напр., в результате такой работы вполне возможны дубликаты (пример наугад, не самый удачный; надеюсь поймёте):
Цитироватьголова > начальник
Цитироватьлоб > начальник
Я так понимаю, вы думаете, что я предложил бы здесь объединить значения лоб и голову в некую гиперсемантему, или расчленить голову на атомы и выудить оттуда лоб... Нет.
Я бы предложил, как первый шаг, придерживаться строгого подхода и ничего не трогать. Т.е. иметь два этих дубликата как два совершенно отдельных перехода (ибо именно так засвидетельствовано в имеющихся этим. словарях с обоснованным историческим свидетельством).
Если обработать тысячи языков (в конечном счёте), а каждый имеет по десятки тысяч слов - в таком случае наличие таких дубликатов не сильно повлияют на индекс вероятности отдельного взятого перехода (т.е. казалось бы, разделение на дубликаты уменьшало бы вероятность отдельно взятого перехода, но это не так). Вся соль в том, что гигантски большой массив данных позволит игнорировать такие статистические огрешки, связанные с некорректностью некоторых изначальных этимологий и значених, взятых у совр. этимологов (между прочим, использующих ваш же облюбленный герменевтический метод). Т.е. мои предпосылки те же, что и у совр. этимологов, те разве что только надеются на эфемерный здравый смысл + первые попавшиеся паралелли из словаря под рукой; я же присовокупляю сюда проверку строгой статистической аналитикой всего имеющегося накопленного материала.
Здесь если дальше проработать, то можно много хитрых штук делать. Например, сами два этих дубликата можно сравнивать целиком, уже вертикально: лоб > голова; и каким-то образом корректировать всю связку в уже двухмерном пространстве (и в трёхмерном и т.д.). Тут очень бы пригодились компьютерные вычисления.
Цитата: Rusiok от сентября 4, 2012, 20:48
Смысл вычленяется так: в одной ситуации говорим так, в другой - иначе (включая ситуации говорения на разных языках) - тогда слово в одной ситуации имеет один смысл, а в другой ситуации - другой. Предметная область ситуаций, вообще говоря, имеет размерность "бесконечность в квадрате".
Отнюдь не бесконечность в квадрате; функция семантического сдвига строго ограничена градуальностью человеческой логики. Нельзя взять встать с утра и начать называть мышей велосипедами. Нет, конечно где-то и могут, только вероятность стремится к нулю. Этимологи опираются на здравый смысл при определении, что вероятно (хороший> добрый), а что невероятно (мышь > велосипед). Однако здравый смысл весьма обманчив, напр. здравый смысл говорит, что если бросить перо и гирю в вакууме, гиря упадёт быстрее.
У каждого слова есть и прямые, и переносные значения, множества их. Однако множественные значения просто навсего являются сосуществующими семантическими сдвигами, унаследованными с предыдущих состояний языка. Во многих случаях, они не существенны для нашей числомолотилки, т.к. если принять, что пробабилистический индекс универсален для всех языков, то и весь упакованный в конкретное слово потенциальный полисемантизм сам по себе уже являются частью такого индекса, а потому более-менее универсален для всех языков. Можно, конечно, аутистам со стажем заняться разработкой индексов внутри полисемантизма конкретных слов, т.е. мы как бы уже от уровня атома перешли бы к уровню кварков.
Цитата: Rusiok от сентября 4, 2012, 20:48
Язык - это система оппозиций, сопоставлений, противопоставлений, а не система атомов, из сочетаний которых...
Аргументация теологов каменного века. Мир-де состоит не из каких-то там атомов, что за глупая затея; мир это постоянно меняющийся мир духов, которых нам в принципе не дано понять, бла-бла-бла. Что за глупость говорите, это же все знают: только галлюциногены, только мистицизм, только хардкор.
Другой вопрос что никто не сказал про культурный вопрос. Культура влияет на перенос значений: что очень вероятно для Папуа-Новой Гвинеи, не очень вероятно для России (но вероятность выше нуля всё равно). Здесь нужно из общей кучи данных (первый этап) найти корреляции по условным культурным регионам, и затем усилить/ослабить переходы, в зависимости от региона. Таким образом, индекс и так был хорош, а тут он и ещё сильнее аппроксимируется.
Также можно было бы в уравнении учитывать и среднюю скорость отдельного взятого семантического перехода; при этимологизации новых слов/реэтимологизации мутных слов было бы тоже весьма полезно (если, конечно, исторические свидетельства датируются).
Цитата: Алексей Гринь от сентября 5, 2012, 17:00
Другой вопрос что никто не сказал про культурный вопрос.
Я Вам писала про монографию Толстой по семантике.
А предложения все подсчитывать мне очень напоминают коэффициенты Нгати.
А как быть со сложными значениями?
Вот тут в соседней ветке поинтересовались этимологией слова
sport. Смотрим:
Цитата: sport (n.) mid-15c., "pleasant pastime," from sport (#post_sport_verb) (v.). Meaning "game involving physical exercise" first recorded 1520s. Original sense preserved in phrases such as in sport "in jest" (mid-15c.). Sense of "stylish man" is from 1861, Amer.Eng., probably because they lived by gambling and betting on races. Meaning "good fellow" is attested from 1881 (e.g. be a sport, 1913). Sport as a familiar form of address to a man is from 1935, Australian English. The sport of kings was originally (1660s) war-making.
sport (v.) c.1400, "to take pleasure, to amuse oneself," from Anglo-Fr. disport (#post_disport), O.Fr. desport "pastime, recreation, pleasure," from desporter "to divert, amuse, please, play".
disport (v.) late 14c., from Anglo-Fr. disporter "divert, amuse," from O.Fr. desporter "to seek amusement," lit. "carry away" (the mind from serious matters), from des- "away" (see dis-) + porter "to carry," from L. portare "to carry".
Цитата: Bhudh от сентября 5, 2012, 17:18
А как быть со сложными значениями?
Не понял вопроса.
Как кучу значений впихнуть в один семантический переход?
Цитата: Bhudh от сентября 5, 2012, 17:30
Как кучу значений впихнуть в один семантический переход?
Рассматривать каждое значение как результат семантического перехода.
Цитата: Bhudh от сентября 5, 2012, 17:30
Как кучу значений впихнуть в один семантический переход?
А где в примере куча значений?
Я о каждом.
Согласитесь, в «pleasant pastime → game involving physical exercise» и справа и слева довольно сложные значения, которые в одну сему не впихнёшь.
Цитата: I. G. от сентября 5, 2012, 17:34Рассматривать каждое значение как результат семантического перехода.
В одном слове?
Если у него 10 значений, это уже така-ая паутина получится...
Цитата: Bhudh от сентября 5, 2012, 17:47
Цитата: I. G. от сентября 5, 2012, 17:34Рассматривать каждое значение как результат семантического перехода.
В одном слове?
Если у него 10 значений, это уже така-ая паутина получится...
А в чем проблема? :what:
Какое именно значение из паутины брать, буде из этой полисемии новое слово выпуклилось? :umnik:
Все сразу?
Цитата: Bhudh от сентября 5, 2012, 17:49
Какое именно значение из паутины брать, буде из этой полисемии новое слово выпуклилось? :umnik:
Все сразу?
То, из которого выкуклилось, и брать.
А если неизвестно, из какого именно, а из 10-и есть 3‒5 подходящих?
Цитата: Bhudh от сентября 5, 2012, 17:52
А если неизвестно, из какого именно, а из 10-и есть 3‒5 подходящих?
Предположить одно.
В любом случае все эти процедуры будут гипотетичны, поэтому подсчеты дадут результат, писанный вилами по воде.
Если говорить о древнейших состояниях, то там семантическая структура слова вообще только предположительна.
Там она по дефолту включает все значения, предполагаемые из неё происхождёнными. Плюс их общий аттрактор.
Цитата: I. G. от сентября 5, 2012, 17:54
Цитата: Bhudh от сентября 5, 2012, 17:52А если неизвестно, из какого именно, а из 10-и есть 3‒5 подходящих?
Предположить одно.
В любом случае все эти процедуры будут гипотетичны, поэтому подсчеты дадут результат, писанный вилами по воде.
Молодцы, расписались в собственной беспомощности. Эти процедуры используют ту же механику, что и совр. обычная этимология. Поэтому я и говорю, что вилы по воде нужно исправлять статистической выправкой.
Цитата: Алексей Гринь от сентября 5, 2012, 18:39
Поэтому я и говорю, что вилы по воде нужно исправлять статистической выправкой.
Как статистика может исправить недостаток данных?
Не, Алексей, то, о чём вы говорите, понятно. Но право слово, это такой адский труд, особенно если пытаться систематизировать все эти переходы в тысячах языков...
Семантика - слишком тонкая материя, угу. И слава Богу, что есть люди, которые ей занимаются, потому что лично у меня уже на пятой минуте голова кругом идёт.