Шё̄шӄуй шэ̄, чӯмӭльӄут шэ, чумыт шэ, сӱсӱгуй сэ и мн.др. – язык южных селькупов, коренных жителей Томской области - Среднего Приобья. В настоящее время носители есть в Каргасокском, Парабельском, Колпашевском, Верхнекетском и, предположительно, Александровском районе Томской области. Число носителей: до 70-80 человек. Большинство южных селькупов, а их около 1200 человек, языка не знают. В Молчановском районе (на нижнем Чулыме) у селькупов сохраняется самоназвание, тогда как местный говор вымер 50 лет назад.
Язык давно и интенсивно изучается томскими учёными, начиная с А.П. Дульзона, однако состояние языка от этого не очень-то улучшается. На кафедре языков Сибири ТГПУ хранится 80 томов южноселькупских полевых сборов, каждый по 1000 страниц, в т.ч. записи начала 50-х годов ныне вымерших крайне южных говоров.
Материалы:
http://www.twirpx.com/file/1348997/ самый полный южноселькупский словарь +диалекты Турухана и Елогуя
http://www.twirpx.com/file/1128138/ небольшой словарь, но в нём есть некоторые слова, которых нет в предыдущем словаре
http://www.twirpx.com/file/1958443/ первая часть южноселькупской морфологии (есть и вторая в томских библиотеках)
http://www.twirpx.com/file/1378871/ разговорник с грамматическим очерком
http://www.twirpx.com/file/1084188/ фольклорные тексты с построчным переводом на говорах шёшкупов и чумылькупов
http://www.twirpx.com/file/1971244/ учебник диалекта шёшкуп
http://www.twirpx.com/file/2011025/ Шё̄шӄуй букварь
http://www.twirpx.com/file/1735137/ словарь кетского диалекта
ну и ещё на том сайте можно найти
Кратко о языке (в дальнейшем всё опишу подробнее):
Обычный порядок слов SOV. Агглютинация (самодийский же). Глагол имеет субъектное и объектное спряжение. Парадигма существительных - 11-15 падежей в зависимости от локального говора. Есть (по кр.мере были) аналитические конструкции. В фонологии: есть долгие гласные (смыслоразличительная функция слабая), главная фишка консонантизма - звонкая аффриката /дж/ /җ/. Количество алфавитов языка равно количеству изданий на нём. Состояние сохранности - плохое, но на данный момент есть ~3 языковых активиста.
Ну и для начала: текст с построчным переводом и глоссированием из ТГПУ: http://siblang.tspu.ru/project09/RUSS/Selkup.htm
Пе̄ге кут таре̄дык азымба
Рябчик человеком стал
Hazel-grouse
(Селькупский язык)
1) Ара́ пая́сык̜ варкымба. 2) Таблана́н эльма̄дла тя̄н̜гузат. 3) Табла варкызат, сӯрулап варза́т, авра́лджэшпызат. 4) Ара́т мадёнд к̜ва̄за. 5) Оккыр ба̄р ча̄джа, к̜онджырныт, пе̄ге а̄мда. 6) Таб кыгымба тӱ̄лсэзэ тя̄ччыгу. 7) На пе̄ге к̜ут таре̄дык ӭ̄джа́лгва: «Ма́шеп ык тя̄чклел! Мат ӣт тя̄т те̄ка э̄нджак. К̜вандлел машэп ма̄тк̜энд!». 8) Ара́га ӣмбат пе̄геп и пӣгылба ма̄т. 9) Кве̄ссэ ма̄т тӧ̄мба, пая́г̜ынд ӭ̄джалгва: «Мат ӣм тада́п». 10) На пая́га ӭ̄джа́лгва: «На к̜ай ӣ, на пе̄ге». 11) Та́бып варза́т кушай пот. 12) На пе̄ге ӭ̄джа́лгва азе́г̜ынд, аве́г̜ынд: «Машэп на̄дли́». 13) Ара́га пая́газэ ӭ̄джа́лгват: «Тат пе̄ге, код те̄ка к̜ванджа ва́ркыгу». 14) А пе̄ге к̜ут таре̄дык чэ̄нча: «К̜ӧшкленд арг э̄дэнд, наття̄т варка варг̜ ол. Табнан на̄гур нэ̄т». 15) Ара́гат кӧндып саре́лбат, к̜аг̜лонд омда, к̜ванна́. 16) Арг э̄дэнд тӧ̄мба, кӧндып сарымбат, ма̄т шэрна. Таб торо́вайчэс. 17) На варг̜ ол сог̜ындя́: «К̜айк̜о тӧ̄мманд миг̜нут?». 18) «А мат натк̜о тӧ̄мбак, манна̄ни̇ ӣм на̄дыгу кыга́. Ти̇нна̄ни̇ нэ̄мд кыга́ ӣгу». 19) На варг̜ ол аза́ кыгыс шарва́тпыгу, табып ве̄сь педьсэ́ падя́лбат, К̜аг̜лонд панбат, кӧндып ӱ̄дымбат. 20) Кӧнд ма̄т тӧ̄мба, ква̄нд наттидэли шэрба. 21) Пая́га по̄нэ чаннымба́, натидэ̄ли к̜ванна, а наттяг̜ын к̜онджырныт – ара́т падя́лбле эппа к̜аг̜лог̜ыт. 22) Таб ма̄т шэрле тю̄ра, ӣг̜ынд ӭ̄джалгва: «К̜ай тат ме̄ммындал? Азе́мд падя́лбат» 23) Таб аве́г̜ынд ӭ̄джалгва: «Шӣвп палле́л чаннэ́нд!». 24) Шӣвт па̄ронд палле́л вадин лагалап!» 25) На ӣд вадип нялдённыт тобла́ндысэ, азыт эннэ́ важа́ ай к̜умле азымба. 26) Ӣт сог̜ынде̄шпат азег̜ынд: «К̜ай варг ол аза меккут нэ̄мд?». 27) Ара́га ӭ̄джа́лгва: «Шарва́тпыгу аза́ кыга́». 28) Шэдымджэ̄ли те̄лт таб азе́г̜ынд ӭ̄джа́лгва: «К̜валле́нд натидэ̄ли, шэдымджэ̄ли нэ̄мд ӣгу». 29) Таб кӧндып саре́лбат ай натидэ̄ли к̜ванна арг э̄дэнд. 30) Кӧндып са̄рымбат ай ма̄т шэрна. Торовайчыс. 31) На варг̜ ол сог̜ындя: «К̜айк̜о миг̜нут тӧ̄мманд?». 32) Таб ӭ̄джалгва: «Ай тӧ̄мбак, манна̄ни̇ ӣм кыга́ на̄дыгу. Манна̄ни̇ ӣм пе̄ге». 33) На варг̜ ол ай табын к̜аймназа ӭ̄джа́лгва, по̄нэг̜ын ве̄сь падя́нныт, табып к̜аг̜лонд панба́т. Кӧндым ӱ̄дыт. 34) Кӧнд тӧ̄мба ма̄т ай ква̄нд шэрна. 35) Пая́га по̄нэ чаннымба́ ква̄нд, натидэ̄ли к̜ванна, к̜онджырныт: ара́т падялбле эппа. 36) Таб ай тю̄рле ма̄т шэрна, ӣг̜ынд ӭ̄джа́лгва: «Азе́м ай ве̄сь падя́лбат». 37) Ӣд ӭ̄джа́лгва: «Ык тю̄рленд! Ай шӣвп чаннэ́нд палле́л, шӣвт па̄ронд вадит лага́лап ве̄сь палле́л». 38) Азыт важымба. 39) Ӣт сог̜ынде̄шпа: «К̜ай ӭджалгва варг̜ ол?» «Аза меккут нэ̄мд». Ӭ̄джалгва: «Код табсэ́ варке̄нджа, танна̄ни̇ ӣл пе̄ге. Натк̜о машэп падя́лбат». 40) Нагурумджэ̄ли те̄лег̜ынд ӣд ӭ̄джалгва: «Кӧндып саре̄лбе ай ча̄джленд натидэ̄ли, нагурумджэ̄ли нэ̄мд менджыт». 41) Ара́га саре́лбат кӧндып, к̜ванна́ натидэ̄ли. Ай тӧ̄мба, ма̄т шэрба. Торовайчыс. 42) На варг̜ ол ай сог̜ындя: «К̜айк̜о тӧ̄мманд?» «Мат тӧ̄мбак ти̇̄ нэ̄мд нагурумджэ̄ли ӣгу онэ́г̜эк ӣг̜эк пая́т тя̄т». 43) Но на варг̜ ол ӭ̄джа́лгва нэ̄г̜ынд: «Кыганд к̜вангу к̜умни̇ ча̄джленд». Аза́ кыганд ма̄тк̜ын а̄мдле. 44) На нэ̄д шэ̄рбынди̇ мыла́п шэ̄рбат, ара́газэ к̜ванба натидэ̄ли варкыгу́. 45) Натидэ̄ли тӧ̄мбат, авыт ӣндсэ қвэдэлдят. 46) Ма̄т тӧ̄лджат на надэ́п. 47) Таб нягджэмба. 48) Пая́га остолт па̄ронд так̜к̜ылбат. 49) Авре̄шпымбат, ӱдэ̄шпызат. Кватта́лджымбат варкыгу́. 50) Табла́ сва̄ң варкызат, таб пая́мд на̄дырс.
(Русский язык)
1) Жили старик со старухой. 2) Детей у них не было. 3) Они жили, скот держали, кормили. 4) Старик в лес ходил. 5) Однажды идет, увидел – рябчик сидит. 6) Он хотел из ружья выстрелить. 7) Вот рябчик человеческим голосом говорит: «Не стреляй в меня! Я тебе сыном буду Унеси меня домой!». 8) Старик взял рябчика и вернулся домой. 9) Назад домой пришел, своей жене сказал: «Я сына принес». 10) Ну, старуха говорит: «Какой это сын, это рябчик». 11) Держали его несколько лет. 12) Вот рябчик говорит своему отцу, матери: «Жените меня!» 13) Старик со старухой говорят: «Ты рябчик, кто пойдет к тебе жить?» 14) А рябчик человеческим голосом говорит: «Съезди в другую деревню, там живет царь. У него три дочери». 15) Старик коня запряг, в сани сел, уехал. 16) В другую деревню приехал, коня привязал, в дом вошел. Он поздоровался. 17) Этот царь спрашивает: «Зачем к нам приехал?» 18) Я потому приехал, что мой сын хочет жениться. Хочет взять вашу дочь». 19) Тот царь не хотел разговаривать, его всего топором изрубил, в сани положил, коня отпустил. 20) Конь домой пришел, во двор туда зашел. 21) Старуха на улицу вышла, а там увидела – её муж изрубленный лежит на санях. 22) Она домой зашла, плачет, своему сыну сказала: «Что ты наделал? Отца изрубили». 23) Он сказал своей матери: «Положи золу в корыто!» 24) «На золу положи куски мяса!». 25) Этот сын мясо топтал ногами, отец встал и человеком стал. 26) Сын говорит отцу: «Что царь не дает свою дочь?» 27) Отец сказал: «Разговаривать не хочет». 28) На второй день он говорит отцу: «Поезжай туда вторую дочь взять». 29) Он лошадь запряг и туда поехал в другую деревню. 30) Он лошадь привязал и в дом вошел. Поздоровался. 31) Тот царь спрашивает: «Зачем к нам приехал?» 32) Он сказал: «Снова приехал, мой сын хочет жениться. Мой сын – рябчик». 33) Тот царь снова ничего не сказал, на улице всего изрубил, его в сани положил. Лошадь отпустил. 34) Лошадь пришла домой и во двор зашла. 35) Старуха на улицу вышла во двор, туда пришла, увидела – её муж изрубленный лежит. 36) Она снова плача в дом вошла, сыну сказала: «Отца снова всего изрубили». 37) Сын сказал: «Не плачь! Снова золу в корыто положи, на золу куски мяса положи!» 38) Отец встал. 39) Сын говорит: «Что сказал царь?» – «Не дает дочь». Сказал: «Кто с ним будет жить, твой сын – рябчик. Поэтому меня зарубил». 40) На третий день сын сказал: «Лошадь запряжешь и поедешь туда, третью дочь он отдаст». 41) Старик запряг лошадь, уехал туда. Снова приехал, в дом вошел. Поздоровался. 42) Тот царь снова спросил: «Зачем приехал?» – «Я приехал сюда третью дочь взять своему сыну в жены». 43) Но тот царь сказал дочери: «Хочешь идти замуж, иди. Не хочешь, дома сиди». 44) Эта дочь надела одежду, со стариком поехала туда жить. 45) Туда приехали, мать с сыном встретили. 46) В дом привели эту девушку. 47) Она разделась. 48) Старуха на стол собрала. 49) Поели, выпивали. 50) Начали жить. Они хорошо жили, он свою жену любил.
P.S. Это первый пост в самодийском разделе в этом году и первая самодийская тема за год, с чем всех и поздравляю!
Цитироватьтекст с построчным переводом и глоссированием из ТГПУ: http://siblang.tspu.ru/project09/RUSS/Selkup.htm
Тексты (по ссылке) очень хорошо проработаны - есть частеречная разметка (POS) селькупского оригинала и параллельный перевод, при этом 416 словоупотреблений, но написано, что можно запросить полный текст. Что, если попробовать импортировать эти тексты в какую-нибудь электронную корпусную систему, например, в ANNIS http://corpus-tools.org/annis/ (http://corpus-tools.org/annis/).
Если имеется параллельный перевод, это позволит объективно изучить количество употреблений слов по разной тематике, перевод разнообразных конструкций. Также можно будет оценивать, в каких тематических/грамматических областях недостаёт нужной информации, запрашивать её (анкетами, почтой) и добавлять в корпус.
Цитата: Krasimir от октября 31, 2016, 08:58
В Молчановском районе (на нижнем Чулыме) у селькупов сохраняется самоназвание, тогда как местный говор вымер 50 лет назад.
:fp: конечно же,
самосознание. Чумуль ӄуланан онҗ нэп ӄадӭ сомбласару пот кве̄ссэ, най шэ̄дыт. Самоназвание чулымских селькупов
тюйкум вымерло 50 лет назад вместе с языком, а вот самосознание (мы - остяки, селькупы) и отд. элементы культуры (орудия, приметы) сохраняются. Селькупы вроде остались и в Бакчарском районе (глухие лесо-болотные места в верховьях неэтимологизированных левых притоков Оби), только там никакой общественной активности нет.
Районы в википедии:
(wiki/ru) Каргасокский_район (https://ru.wikipedia.org/wiki/%D0%9A%D0%B0%D1%80%D0%B3%D0%B0%D1%81%D0%BE%D0%BA%D1%81%D0%BA%D0%B8%D0%B9_%D1%80%D0%B0%D0%B9%D0%BE%D0%BD)
(wiki/ru) Верхнекетский_район (https://ru.wikipedia.org/wiki/%D0%92%D0%B5%D1%80%D1%85%D0%BD%D0%B5%D0%BA%D0%B5%D1%82%D1%81%D0%BA%D0%B8%D0%B9_%D1%80%D0%B0%D0%B9%D0%BE%D0%BD)
(wiki/ru) Парабельский_район (https://ru.wikipedia.org/wiki/%D0%9F%D0%B0%D1%80%D0%B0%D0%B1%D0%B5%D0%BB%D1%8C%D1%81%D0%BA%D0%B8%D0%B9_%D1%80%D0%B0%D0%B9%D0%BE%D0%BD)
(wiki/ru) Колпашевский_район (https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%BB%D0%BF%D0%B0%D1%88%D0%B5%D0%B2%D1%81%D0%BA%D0%B8%D0%B9_%D1%80%D0%B0%D0%B9%D0%BE%D0%BD)
(wiki/ru) Молчановский_район (https://ru.wikipedia.org/wiki/%D0%9C%D0%BE%D0%BB%D1%87%D0%B0%D0%BD%D0%BE%D0%B2%D1%81%D0%BA%D0%B8%D0%B9_%D1%80%D0%B0%D0%B9%D0%BE%D0%BD)
(wiki/ru) Бакчарский_район (https://ru.wikipedia.org/wiki/%D0%91%D0%B0%D0%BA%D1%87%D0%B0%D1%80%D1%81%D0%BA%D0%B8%D0%B9_%D1%80%D0%B0%D0%B9%D0%BE%D0%BD)
Селькупский язык как группа языков? :)
Цитата: Teodor от октября 31, 2016, 19:30Что, если попробовать импортировать эти тексты в какую-нибудь электронную корпусную систему
Сейчас я обдумываю похожий проект: неким способом собрать все ныне существующие словари и разговорники (с 19 в. до позднейших изысканий) в сводную таблицу, где каждое слово/выражение будет сцеплено со своим переводом и словарными пометами. В итоге предполагаю открыть сайт, подобный этому: http://www.speech.nw.ru/NenNgan/Dictionary/dictionary.html
где будет поле ввода, и по запросу будут показываться все возможные переводы. Проблемы здесь такие:
1. Нечёткость распознавания: ю̈̄ӭӧӱӓи̇ӭ̄ӧ̄ӱ̄ӓ̄и̇̄э̄о̄ӯа̄ӣе̄ё̄ю̄я̄ы̄ӄӈӷҗҙю̈ә Ю̈̄ӬӦӰӒИ̇Ӭ̄Ӧ̄Ӱ̄Ӓ̄И̇̄Э̄О̄ӮА̄ӢЕ̄Ё̄Ю̄Я̄Ы̄ӃӇӶҖҘЮ̈ - и что прикажете мне с этим делать?
2. Сколько изданий - столько и алфавитов. Там, где надо, как-то заменить дж на җ, ҙ на дз, ә на ӭ и т.п., чтобы унифицировать письменность.
3. отделить перевод от словарных помет и примеров употребления, чтобы на "пайдугу" находилось "вилять (хвостом)" и ничего лишнего.
4. поставить на каждый перевод помету, из какого словаря/разговорника/пособия взято
5. собственно написать такой код для сайта
Для создания такого сводного словаря в табличном и поисковом виде придётся закопаться в книжки по программированию, но я доведу эту идею до ума.
Цитата: Teodor от октября 31, 2016, 19:30
Цитироватьтекст с построчным переводом и глоссированием из ТГПУ: http://siblang.tspu.ru/project09/RUSS/Selkup.htm
Тексты (по ссылке) очень хорошо проработаны - есть частеречная разметка (POS) селькупского оригинала и параллельный перевод, при этом 416 словоупотреблений, но написано, что можно запросить полный текст. Что, если попробовать импортировать эти тексты в какую-нибудь электронную корпусную систему, например, в ANNIS http://corpus-tools.org/annis/ (http://corpus-tools.org/annis/).
Если имеется параллельный перевод, это позволит объективно изучить количество употреблений слов по разной тематике, перевод разнообразных конструкций.
Мысль хорошая, тоже пригодится в деле возрождения языка :eat: По сути, принцип создания сводного корпуса и его возможности схожи со сводным глоссарием. Как можно убедиться, на сайте ТГПУ есть только 1 южноселькупский текст, и тот неполный. Онлайн тексты есть ещё здесь:
http://www.twirpx.com/file/1084188/ Быконя В.В. Сказки нарымских селькупов: книга для чтения на селькупском языке с переводом на русский язык
И здесь:
http://www.twirpx.com/file/2011025/ Быконя В.В., Ким А.А., Купер Ш.Ц. Шё̄шӄуй букварь для 1-го класса селькупских школ
Но с букварём есть одна загвоздка: тексты-те в нём есть, но без перевода. Есть ещё брошюра Быкони В.В. с методическими указаниями с построчным переводом каждого текста, вот где жемчуг! На неделе всенепременно возьму эту книгу в томской библиотеке и выложу на твирпкс.
Цитата: Teodor от октября 31, 2016, 19:30
Также можно будет оценивать, в каких тематических/грамматических областях недостаёт нужной информации, запрашивать её (анкетами, почтой) и добавлять в корпус.
С "запрашивать" интересная ситуация сложилась, но об этом как-нибудь потом, надо собраться с мыслями :)
Цитата: Nevik Xukxo от ноября 1, 2016, 09:30
Селькупский язык как группа языков? :)
Обращаюсь ко всем: лучше не читайте статью в википедии о селькупском языке. Не воспринимайте за 100% истину хотя бы.Единый селькупский язык распался лет 400 назад, когда козаченьки вместе с сургутскими хантами в авангарде после многих неудачных попыток разогнали местный территориально-родовой союз, вследствие чего все жители Таёжного Приобья были объясачены и чуть ли не половина селькупов ушла на север, в совр. ЯНАО, верховья Таза и Пура, места настолько глухие, что русская власть там окончательно закрепилась только к 1930-м годам, ещё небольшая группа осела на Турухане и Елогуе. Так и не стало ни языковой, ни территориальной общности селькупов. Больше они никогда не контактировали, языки разошлись далеко, северноселькупский и южноселькупский невзаимопонятны вообще, что-то распознать можно только в записанных текстах, а на слух вообще никак. Поэтому, когда вам начинают рассказывать о селькупском языке, первый вопрос: о каком? Если обо всех сразу, то вам загоняют сравнительный анализ.
Даже в современном южноселькупском тьма диалектов и говоров, а 500 лет назад, пока не подпёрли тюрки с юга, существовали ещё 2 больших наречия (континуума говоров), от которых сейчас осталось маленько топонимов и всё!
Цитата: Krasimir от ноября 1, 2016, 09:46Там, где надо, как-то заменить дж на җ, ҙ на дз
И получится хрен редьки не слаще? :what: Тут лучше делать выбор для читателя: делать текст с диграфами или с диакритиками. А в базе хранить архиграфемы.
Цитата: Bhudh от ноября 1, 2016, 10:01
Цитата: Krasimir от ноября 1, 2016, 09:46Там, где надо, как-то заменить дж на җ, ҙ на дз
И получится хрен редьки не слаще? :what: Тут лучше делать выбор для читателя: делать текст с диграфами или с диакритиками. А в базе хранить архиграфемы.
1. Просто җ хотя бы известна селькупам и они её хоть иногда употребляют на письме, тогда как ҙ встречается в одном словаре и для самих селькупов едва ли понятна.
2. Сама аффриката Җ ну очень частотна в языке, Ҙ, напротив, очень редка.
3. Выбор для читателя дж/җ и т.п. - мысль хорошая, но это ещё один технический наворот, дай бог с этим всем разобраться :eat:
Цитата: Krasimir от ноября 1, 2016, 09:46
Как можно убедиться, на сайте ТГПУ есть только 1 южноселькупский текст, и тот неполный. Онлайн тексты есть ещё здесь:
вот тут файл с полными текстами
https://www.academia.edu/3473592/Editor_Russian-English_Annotated_Folk_Texts_of_Ob-Yenissei_Area._2010._V-1._Отв.редактор_Аннотированные_фольклорные_тексты_обско-енисейского_языкового_ареала._2010._Том-1
на южноселькупском там полсотни страниц аннотированных текстов.
там же еще три тома текстов, в каждом на селькупские тексты по несколько десятков страниц отведено
https://www.academia.edu/3473582/Editor_Russian-English_Annotated_Folk_Texts_of_Ob-Yenissei_Area._Tomsk._2012._V-2._Отв.редактор_Аннотированные_фольклорные_тексты_обско-енисейского_языкового_ареала._Томск._2012._Том-2
https://www.academia.edu/8572404/Editor_Russian-English_Annotated_Folk_Texts_of_Ob-Yenissei_Area._2013._V-3._Отв.редактор_Аннотированные_фольклорные_тексты_обско-енисейского_языкового_ареала._2013._Том-3
https://www.academia.edu/19866593/Editor_Russian-English_Annotated_Folk_Texts_of_Ob-Yenissei_Area._2015._V-4._Отв.редактор_Аннотированные_фольклорные_тексты_обско-енисейского_языкового_ареала._2015._Том-4
Цитатель, спасибо огромное за такую наводку! := Есть теперь, над чем поработать! К тому же теперь ясно какой объём южноселькупских текстов из тех 80 томов обработан и оцифрован. В первом томе целиком приводится Пе̄ге кут таремба и сказка Нення ай темня, что-то подобное опубликовано в "сказках нарымских селькупов".
Перезалил 4 тома аннотированных текстов обско-енисейского языкового ареала на твирпѯ:
http://www.twirpx.com/file/2073179/ - том 1
http://www.twirpx.com/file/2073199/ - том 2
http://www.twirpx.com/file/2073198/ - том 3
http://www.twirpx.com/file/2073200/ - том 4
По прежнему не могу нарадоваться такой находке! ;up:
ЦитироватьДля создания такого сводного словаря в табличном и поисковом виде придётся закопаться в книжки по программированию, но я доведу эту идею до ума.
Я уже имею опыт создания таких словарей/корпусов, обработки данных и пр., так что с радостью готов помочь :yes:. Ещё в моём распоряжении имеется сервер, на котором можно разместить проект (кроме ANNIS есть ещё много разных платформ, лучше использовать их, чем писать с нуля, т. к. там уже есть отработанные технологии поиска (AQL в ANNIS'е, например), которые были часто темами научных работ).
Аннотированные тома - шедевр! Они представлены в символьном PDF, и это очень хорошо, т. к. могут быть быстро обработаны.
А южноселькупский сейчас хоть немного жив? Я когда-то интересовался вопросом и у меня сложилось впечатление, что из селькупских живой (и то еле-еле) только северный (тазовский)
В вышедшем в 97-ом году сборнике статья о южных селькупах называлась не иначе как "В сибирской тайге умирает народ".
ЦитироватьПри этом существуют кардинальные различия языковой ситуации
между двумя крупными и практически полностью изолированными друг
от друга группами селькупов, которые не осознают своего этнического
единства - северной (тазовско-енисейской) и южной (тымско-нарымско-
кетско-обской) (Казакевич 1996: 208; Кузнецова, Болсуновская 1996:
262-263). Если у северных селькупов 77% населения признают селькупский
язык родным, то у южных - лишь 11%. На юге сфера употребления
селькупского языка катастрофически сужается, в семье по-селькупски
говорят между собой только представители старшего поколения, молодежь
языка не знает, дети учат его в школе как иностранный. На севере
селькупский язык функционирует в семье и в традиционной производственной
деятельности
Это цитата из статьми Н.Б. Вахтина о языковом сдвиге у КМНС.
С тех пор больше 20 лет прошло
Южноселькупский язык однозначно жив, и как минимум 3 человека знают его на таком уровне, чтобы свободно говорить и переводить. С одним таким известным носителем (Наталья Платоновна Иженбина) из Колпашевского района я разговаривал лично 3 раза в этом году. Носительница-та свободно переключается с русского языка на южноселькупский, переводит на ЮС целые тексты и отдельные слова - запросто, вот, н-р, её текст: https://www.youtube.com/watch?v=mV6fD8td_Uo. Ещё есть 2 языковых активиста в Парабельском районе, см., н-р, здесь (Ирина Петровна Коробейникова): https://www.youtube.com/watch?v=0rVmavn7TPs
Откуда взялась цифра в 40-80 носителей в стартовом топике: на основании разных, иногда с противоречивыми данными, научных статей, на основании собственных изысканий и по ощущениям самих южных селькупов (а как вы думаете, сколько человек во всех районах на разных уровнях знают язык?)
Ну и не могу не расказать такую историю. Один мой знакомый летом 2015 года был на археологических раскопках в деревне Рыбинск (https://ru.wikipedia.org/wiki/%D0%9F%D0%B0%D0%BB%D0%BE%D1%87%D0%BA%D0%B8%D0%BD%D1%81%D0%BA%D0%BE%D0%B5_%D1%81%D0%B5%D0%BB%D1%8C%D1%81%D0%BA%D0%BE%D0%B5_%D0%BF%D0%BE%D1%81%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5) в среднем течении Кети. По его словам, в этой деревне живёт дедушка, который вовсю говорит на "кетском" языке, и знакомый лично слышал эту речь и она была вполне обычной. Но как узнать у нелингвиста, что язык такой "кетский"? Спросил: встречался ли в его речи звук /дж/ ? Ответ - да. Кетско-русский словарь диалекта средней Кети. (http://www.twirpx.com/file/1992777/) Это словарь настоящего кетского языка, пошиба как раз со средней Кети, и в этом словаре я не обнаружил ни одного буквосочетания дж, ну а эта аффриката - лакмусовая бумажка южноселькупского, её любят во всех говорах, даже в тех, что уже вымерли давно. Так что - то был классный носитель кетского селькупского диалекта. Также в Катайге (https://ru.wikipedia.org/wiki/%D0%9A%D0%B0%D1%82%D0%B0%D0%B9%D0%B3%D0%B0_(%D0%BF%D0%BE%D1%81%D1%91%D0%BB%D0%BE%D0%BA)) (верховья Кети) вроде есть 2 носителя (http://minlang.srcc.msu.ru/sites/default/files/lib/tomskaya_oblast_2010.doc). Не пугайтесь описанных в этой статье "ужасов", её авторы были даже не во всех посёлках по Кети и Тыму, а на Обь и левобережье и заходить не думали, хотя там ЮС язык как раз лучше сохранился (разговаривал в этом году с одним из её авторов).
Ну и в Туруханском районе местные селькупские говоры кое-как сохраняются (см. где-то здесь) (http://minlang.srcc.msu.ru/), а ещё 10 лет назад там фиксировались случаи русско-селькупско-какого-то трёхъязычия, а это вообще отголосок древности! У северных селькупов вообще вроде всё очень хорошо с языком, где-то читал, что в ЯНАО есть дети, для которых русский неродной, а родной селькупский, и в школу они приходят с минимальными знаниями РЯ после позднего наущения от родителей.
Цитата: Teodor от ноября 1, 2016, 19:32
Я уже имею опыт создания таких словарей/корпусов, обработки данных и пр., так что с радостью готов помочь :yes:. Ещё в моём распоряжении имеется сервер, на котором можно разместить проект (кроме ANNIS есть ещё много разных платформ, лучше использовать их, чем писать с нуля, т. к. там уже есть отработанные технологии поиска (AQL в ANNIS'е, например), которые были часто темами научных работ).
Аннотированные тома - шедевр! Они представлены в символьном PDF, и это очень хорошо, т. к. могут быть быстро обработаны.
Конечно же, предложение принимается! :UU:
Однако проблема нечёткого распознавания является главным препятствием на пути к созданию сводного корпуса и словаря.
Не вычитывать же тысячи слов, я вон сегодня ма-ахонькую брошюрку вычитывать подутомился... С чего же начнём?
Также в недалёком будущем думаю поднять все материалы по саянским самодийским, и ко всем зафиксированным словам подобрать южноселькупские переводы и создать такой же электронный сводный словарь. Можно будет выявить преинтересные параллели. Это не должно быть технически сложно.
[offtop]
Ну и совсем уж потом на весь обь-енисейский ареал можно замахнуться со всеми словарями ::) [/offtop]
Пусь кажна танэнҗат оӷолалҗэшпыгу шё̄шӄуй ай сӱсекой шэндлап, штоб табын сва̄к э̄за!Сӱсекоп - так называли шёшкупы (колпашевские) всех остальных селькупов.
Цитата: Krasimir от ноября 2, 2016, 18:24С чего же начнём?
Сейчас для начала автоматически обработал несколько предложений из первого тома, через скрипт перевёл в JSON-формат.
Лемматизацию и определение форм делаю через словарь Зализняка и/или Викисловарь. Результаты авто-обработки первого предложения в картинках прилагаются.
В принципе, отладив возможные баги, можно перевести в такой вид все четыре тома. Причём это может быть сделано за 3-4 дня.
ЦитироватьОднако проблема нечёткого распознавания является главным препятствием на пути к созданию сводного корпуса и словаря.
Что касается имеющихся томов, то тут это, мне кажется, вовсе не проблема. Т. к. PDF текстовый, можно просто считать текст из PDF-клиента и загрузить в скрипт (в данном случае, в мой самописный :)). Единственная проблема - универсализация символов, если мы хотим слить множество данных из разных источников + реализовать удобный поиск. Но тут тоже нет особенно сложных задач, главное - определить эталонные символы и разнообразные их представления в других текстах. Всё кодируется юникодом, так что заменить всё можно за пару минут. Что касается интерфейса пользователя во время поиска, то тут можно применить ту же замену в строке запроса, либо сразу предлагать воспользоваться эталонными символами.
Описание скринов:
- Общий графический вид полученного дерева
- Результат поиска по запросу "жить"
- Исходный JSON-код
Быконя В.В. В помощь учителю селькупского языка для работы по букварю (Шёшӄуй букварь). Методические указания (http://www.twirpx.com/file/2074161/)
Методические указания содержат построчный перевод шёшкупского букваря (Шё̄шӄуй букварь (http://www.twirpx.com/file/2011025/)) и рекомендации по его практическому применению в учебном процессе. Предназначены учителям селькупского языка в школах с преподаванием родного языка. Как букварь, так и настоящая методичка ценны исключительно как лингвистический материал (тексты на языке и построчный перевод соотв.), т.к. преподавание по шё̄шӄуй букварю в 1-ых классах не ведётся.
Очень интересное издание, методичка к самому букварю от автора, и самое главное: построчные переводы всех текстов. Когда занимался с букварём, то не все слова и конструкции смог перевести даже с несколькими словарями, такой вот разброс. Тираж 150, вчера взял в библиотеке (http://www.lib.tomsk.ru/) и отсканировал. Также пригодится для электронных корпусов.
Сва̄ нагӭр. Хорошая книга/грамота.
Подсобрал все материалы, которые войдут в сводный словарь.
Словари:
1. СРДС (http://www.twirpx.com/file/1348997/). Селькупско-русский диалектный словарь под ред. проф. Быкони В.В. Самый полный словарь южноселькупских диалектов и диалектов Турухана и Елогуя. СРДС - как БКРЯ для китаистов, его невозможно обойти стороной. Но даже в нём нет множества тонкостей, лексем. Диалектный разброс огромен, в каждой деревне свой говор.
2. Алатало Я. Сӱ̄ссыӷӯй э̄җипсан. Қэ̄тқый қӯланни. Селькупский словарь. Кетский диалект. (http://www.twirpx.com/file/1735137/)
3. Быконя В.В., Ким А.А., Купер Ш.Ц. Словарь селькупско-русский и русско-селькупский. (http://www.twirpx.com/file/1128138/) Совсем небольшой словарь, но в нём есть некоторые моменты, которых нет в СРДС. Предположительно, писался для нужд шёшкупского образования (вышел также букварь, методичка к нему, учебное пособие по языку, книга для чтения).
4. Alatalo Jarmo. Sölkupisches Wörterbuch (http://www.twirpx.com/file/1378889/). Южноселькупско-немецкий словарь.
Разговорники:
5. Быконя В.В. Шарватпленд шёшӄуй шэндсэ! Говори по шёшкупски (русско-селькупский разговорник) (http://www.twirpx.com/file/1378871/) с грамматикой
6. Купер Ш., Пустаи Я. Селькупский разговорник (нарымский диалект) (http://www.twirpx.com/file/1378876/)
7.-10. Вышеуказанные тома размеченных текстов.
Завтра напишу "стародавние" словари.
Унификация символов:
ә - ӭ, ӭ̄ (соотв.)
ю̈ - ӱ
i - и̇, и̇̄
ҙ - дз
қ - ӄ
ң - ӈ
ӌ, ҷ - ч
дж - җ
По прежнему сомневаюсь в букве җ. Среди самих селькупов она слабо распространена, но звук-аффриката архичастая. Я б ввёл җ.
Начинаю разбираться с корпусами текстов (пока что был занят). Допустим, у меня есть таблица на 200 пар словоформ в ту и другую сторону в форматах docx и xlsx. Как залить такую таблицу в ANNIS или куда-л. ещё?
Цитата: Teodor от ноября 2, 2016, 19:56
Описание скринов:
- Общий графический вид полученного дерева
- Результат поиска по запросу "жить"
- Исходный JSON-код
По-моему, несть хорошо, когда на запрос
жить выдаётся форма 3 л. ед. ч. Сколько таких форм будет выдаваться в реальном сводном словаре? Варкымбалыт, варка, варкай... В готовом словаре ведь должна быть привязка к лемме, хотя примеры тоже выкидывать не надо (как в СРДС и
Сӱ̄ссыӷӯй э̄җипсан. Қэ̄тқый қӯланни). Ну и такой вопрос: как создать таблицу из pdf? Просто всё перегонять в excel?
P.S. Вот как распарсен СРДС:
варкугу ~ варкeгу /об., тым./ гл., непер., НС – 1) жить: аугалк
хачем cк варкугу /об. Ч/ «без матери трудно жить»; мат эль-
мат тят варкак /об. Ш/ «я ради ребёнка живу»; hуп матhыт
варка /об. Ш/ «человек в доме живёт»; мат варкак фāк /об. Ч/
«я живу хорошо»; комдэгал варкугу hошhай cк /об. Ч/ «без
денег жить плохо»; тават чÿheт варкāт /тым./ «кроты в земле
живут»; логанан матты тюмба, конjeм пудёyeт варка /тым./
«у лисы дом растаял, под корнем живёт»; илысаh варкызаh
эра паязаh /об. С/ «жили-были-они-двое муж с женой-двое»;
2) гостить; см. варгыгу
Krasimir, я Вам в личку написал.
Цитата: Krasimir от ноября 4, 2016, 17:50
Допустим, у меня есть таблица на 200 пар словоформ в ту и другую сторону в форматах docx и xlsx. Как залить такую таблицу в ANNIS или куда-л. ещё?
Собственно, пары словоформ требуются для создания словаря (электронного). А ANNIS - платформа для создания корпусов, он, скорее, даёт возможность анализа частотности, грамматики и пр. Обычно онлайн-словари как платформа создаются индивидуально, я бы взялся за это дело, т.к. могу, в принципе, уложиться в 1-2 недели, и будет готов сайт с доменом и т.д.
Если есть таблица xls, её можно перевести в базу данных SQL, например, а затем сделать интерфейс поиска. То есть сейчас можно нам заняться составлением таких xls, я их соберу и залью.
ЦитироватьНу и такой вопрос: как создать таблицу из pdf? Просто всё перегонять в excel?
Лучше, думаю, начать с тех, которые можно получить в текстовом виде, выделив (т. е. не картинка, а текст), это при помощи регулярных выражений можно обработать и представить в нужном виде (JSON, XLS etc.), но тут для каждого случая пишется индивидуальный скрипт. Если в текстовом виде получить нельзя, нужно использовать FineReader или что-то в этом роде. Но пока, как вижу, у нас ещё есть вещи, которые есть "в тексте". Сейчас поискал в гугле "конвертировать pdf в xls", не очень понимаю, о чем речь, но пока не разобрался.
ЦитироватьПо-моему, несть хорошо, когда на запрос жить выдаётся форма 3 л. ед. ч.
На самом деле, не выдаётся не словоформа. Это просто один из параметров под именем
token. А
lemma - вполне нормальный инфинитив. Дальше из селькупского
analysis, наверное, надо отделить
mb-a и установить инфинитивный суффикс, в таком виде будет пара (я прав?)
Если я что-то недостаточно подробно объяснил или ещё есть какие-то вопросы, прошу задавать :) А то я засыпаю
Переводить pdf в xlsx умеет FineReader, только получается всякое не то (см. вложение)
Цитата: Teodor от ноября 4, 2016, 21:46из селькупского analysis, наверное, надо отделить mb-a и установить инфинитивный суффикс, в таком виде будет пара (я прав?)
Не совсем.
-мб (основы на гласный),
-б (основы на звонкий согласный),
-п (основы на глухой согласный) - это суффиксы результативного прошедшего времени, т.е. такого, последствия которого актуальны для настоящего. Но эти суффиксы бывают не только в парадигме, но и в инфинитве тоже:
апстыгу - накормить,
апстымбугу, апстӭбугу - кормить, прокормить(ся). Также этот суффикс может и не менять семантику глагола:
кодалҗугу ~ кодалҗэ(ы)мбыгу - застегнуть, закрыть на крючок, быть застёгнутым. Ну и наконец, перед показателем инфинитива -гу ~ -ку в случаях вроде
варкугу может стоять ы, у, ӭ, э, они же с макроном. И если в отдельных словах словари указывают 1 вариант гласной, то в других глаголах может стоять любая из 3-4 вышеперечисленных. Не забываем, что на 5 деревень приходится 2 говора (шутка) ;up:
Существительное в южноселькупском языке (парадигмы).Грамматический род отсутствует. Имеется 3 числа, 2 парадигмы склонения, 10-15 падежей в зависимости от конкр. говора. Показатели (суффиксы) числа вставляются между основой и падежным окончанием.
Парадигма безличного склонения (по граммат.очерку разговорника
"Шарватпленд шёшӄуй шэндсэ" (http://www.twirpx.com/file/1378871/) и "Шё̄шӄуй букварю" (http://www.twirpx.com/file/2011025/))
Основа: | на гласный | на твёрдый согласный | на мягкий согласный |
родительный | -т, -н | -ыт, -ын | -ит, -ин |
винительный | -п, -м | -ып, -ым | -ип, -им |
дательно-направительный | -нд, ни̇, -н | -онд, -энд | -ёнд |
местно-временной | -ӷыт | -ӄыт, -о̄ӷыт, -ыт | -ё̄ӷыт |
местно-личный | -нан | -нан, -ннан | |
исходный | -ӷындо, -нандо, -нандыкто, -нандыкти̇ | -ӄындо, -о̄ӷындо, -эӷындо, -нандо, -нандыкто
| -ё̄ӷындо |
продолжительный | -мыт, -выт | -выт, -овыт | -ё̄выт, -ё̄мыт |
орудийно- совместный | -зэ | -сэ, -зэ | -сэ, -зэ |
назначительно-превратительный | -тко, -ӈго | -ытӄо | -итӄо |
лишительный | -галк, -галык | -галк, -галык, -калк, -калык | -галк, -калк |
|
А эти тексты уже упоминались, нет?
Три шамана. Л. А. Коганова
селькупский
Лидия Александровна говорит о том, как стала в детстве свидетельницей камлания трех шаманов: кета, селькупа, эвенка.
Лабаз. Р. С. Куболев
селькупский
В Сибири лабазом называют домик на стойках, где хранятся вещи. Часто это могут быть старые, заброшенные вещи.
http://minlang.srcc.msu.ru/ru/textspage
100:00 — 00:03
eta ja prawda f perwij ras f žiz'ńi viďila i
eta ja prawda f perwij ras f žiz'ńi viďila i
это я правда в первый раз в жизни видела и
Это я правда в первый раз в жизни видела и...
Лингвист: Ой, расскажите по-селькупски про это!
200:04 — 00:07
tože nadyndʼe myžyľi
tože na=dyndʼe my=žyľi
тоже на=Дынде мы=жили
Тоже на Дынде{1} мы жили.
{1} Озеро Дында расположено на водоразделе верховьев Таза и Елогуя, в зоне селькупско-кетско-эвенкийских контактов.
300:07 — 00:09
dynDāqyn mē iľisɔ̄myn
dynDā-qyn mē iľi-s-ɔ̄myn
Дында.SG-LOC мы жить-PST-3.PL.SUB/OB
На Дынде мы жили.
400:09 — 00:11
nymDy jeloGuj nɔ̄n qɔ̄nyj ə qɔ̄nyj qup tǖśit{1} dynnynDy{2}
nymDy jeloGuj nɔ̄n qɔ̄ny-j ə qɔ̄ny-j qup tǖ-ś-it{1} dynny-nDy{2}
тогда/там Елогуй.SG.NOM от кет-ADJ HES кет-ADJ человек.SG.NOM прийти-PST-3.SG.OB Дында.SG-ILL
Там с Елогуя кетский, э-э, кет [=кетский человек] пришел на Дынду.
{1} Употребление в формах прошедшего времени (показатель –s(ś) ) лично-числового показателя -it (вариант показателя 3.SG.OB -ity- с отпадением конечного гласного) вместо показателя 3.SG.SUB –y весьма характерно для рассказчицы. {2} < dyndy-nty.
500:13 — 00:25
sumByqonDōχ tǖśit
sumBy-qo-nDōχ tǖ-ś-it
петь/шаманить-INF-POSS.3.SG прийти-PST-3.SG.OB
Чтобы шаманить (он) пришел на Дынду.
600:27 — 00:29
mēmyqyt qɔ̄nän aj iľisɔ̄tyn
mē=myqyt qɔ̄nä-n aj iľi-s-ɔ̄tyn
мы.PL=у кет-PL.NOM еще/и жить-PST-3.PL.SUB/OB
У нас кеты тоже жили.
700:30 — 00:32
ukkur śöjqumyj
ukkur śöjqumy-j
один селькуп-ADJ
Один селькупский...
800:33 — 00:34
kakže skazatʼ šamantə
kak=že skazatʼ šaman=tə
как=же сказать шаман=то
Как же сказать шаман-то...
Лингвист: tə̄typy (шаман.sg.nom 'шаман')
900:38 — 00:39
ɛ̄ˀ tə̄typy
ɛ̄ˀ tə̄typy
да шаман
Да, шаман.
1000:40 — 00:41
jelogujnɔ̄n tȳ ukkur tə̄typy qɔ̄näŋ tǖśit dynnynDy{1}
jeloguj=nɔ̄n tȳ ukkur tə̄typy qɔ̄näŋ tǖ-ś-it dynny-nDy{1}
Елогуй.SG=из сюда один шаман.SG.NOM кет.SG.NOM прийти-PST-3.SG.OB Дында.SG-ILL
С Елогуя сюда один шаман кет пришел на Дынду.
{1} < dyndy-nDy
1100:41 — 00:42
ukkur mɔ̄tqyn muntyŋ taqqalį̄jsɔ̄tyt tə̄typyt
ukkur mɔ̄t-qyn muntyŋ taqqal-į̄j-s-ɔ̄tyt tə̄typy-t
один дом/чум.SG-LOC весь собрать-INTS.DECS-PST-3.PL.SUB/OB шаман-PL.NOM
В одном чуме все собрались шаманы.
1200:42 — 00:46
ukkur ɛ̄ śöjqumyj tə̄typy ukkur qɔ̄nyj tə̄typy a ukkur
ukkur ɛ̄ śöjqumy-j tə̄typy ukkur qɔ̄ny-j tə̄typy a ukkur
один HES селькуп-ADJ шаман.SG.NOM один кет-AGJ шаман.SG.NOM а один
Один э-э селькупский шаман, один кетский шаман, а один...
1300:46 — 00:50
ɛ̄ bajə{1} oj etot kak jevo əvenkijskij vobšʼem ukkur
ɛ̄ bajə{1} oj etot kak jevo əvenkijskij vobšʼem ukkur
а мужчина[эвенкийское.слово] ой этот как его эвенкийский в.общем один
Ээ, человек, ой, этот, как его, эвенкийский в общем...
{1} Вспоминая, как по-селькупски будет эвенк, рассказчица употребила эвенкийское слово bəjə 'мужчина, человек'
Лингвист: pompak (эвенк 'эвенк')
1400:50 — 01:00
pomBaľ tətypy
pomBa-ľ tətypy
эвенк-ADJ шаман.SG.NOM
Эвенкийский шаман.
1501:00 — 01:08
nɔ̄qor tə̄typy taqqalį̄jśɔ̄t
nɔ̄qor tə̄typy taqqal-į̄j-ś-ɔ̄t
три шаман.SG.NOM собрать-INTS.DECS-PST-3,PL.SUB/OB
Три шамана
1601:09 — 01:10
pūn tə̄pyn nįľčyŋ mɔ̄tyś{1} śüńčōqyn ɔ̄mDysɔ̄t
pūn tə̄pyn nįľčyŋ mɔ̄ty-ś{1} śüńčō-qyn ɔ̄mDy-s-ɔ̄t
потом он/она/оно.PL.NOM так.SLIP дом/чум.SG-GEN нутро.SG-LOC сидеть-PST-3.PL.SUB/OB
Потом они так в чуме сидели.
{1} < mɔ̄ty-n
1701:10 — 01:11
qumyt kōččy tǖsɔ̄tyn
qumy-t kōččy tǖ-s-ɔ̄tyn
человек-PL.NOM много.ADJ прийти-PST-3.PL.SUB/OB
Люди многие пришли.
1801:11 — 01:13
muntyŋ ukkur ukkur mɔ̄tty tǖsɔ̄tyn
muntyŋ ukkur ukkur mɔ̄t-ty tǖ-s-ɔ̄tyn
весь один один дом/чум.SG-ILL прийти-PST-3.PL.SUB/OB
Все в один, (в) один чум пришли.
1901:13 — 01:16
iman qumyj qumyn īńan muntyŋ nymty ɔ̄mtysɔ̄tyt
ima-n qumy-j qumy-n īńa-n muntyŋ nymty ɔ̄mty-s-ɔ̄tyt
женщина-PL.NOM человек-ADJ человек-PL.NOM ребенок-PL.NOM весь тогда/там сидеть-PST-3.PL.SUB/OB
Женщины, мужчины [=человеческие люди], дети – все там сидели.
2001:16 — 01:19
ylna qumyt tə̄tymmɔ̄ttɛľčysɔ̄tyn{1}
ylna qumy-t tə̄tym-mɔ̄tt-ɛľčy-s-ɔ̄tyn{1}
вон.тот человек-PL.NOM шаманить-PFV.DECS-PFV.INTS-PST-3.PL.SUB/OB
Вон те люди расшаманились.
{1} tə̄typy-mɔ̄t-ɛľčy-s-ɔ̄tyn
2101:19 — 01:22
ao jeloGuj nɔ̄ny tǖBij kellog nɔ̄ny jeloGuj nɔ̄ny tǖBij qɔ̄näŋ tə̄tyByt tɔ̄qon paŋysä
ao jeloGuj nɔ̄ny tǖ-Bij kellog nɔ̄ny jeloGuj nɔ̄ny tǖ-Bij qɔ̄näŋ tə̄tyBy-t tɔ̄qon paŋy-sä
HES Елогуй.SG.NOM из прийти-ADJ.PST Келлог.SG.NOM из Елогуй.SG.NOM из прийти-ADJ.PST кет.SG.NOM шаман.SG-GEN позади нож.SG-INS
А с Елогуя пришедший, из Келлога, с Елогуя пришедший кет шаманов позади ножом...
2201:22 — 01:26
man myta nįk tə̄typytt∅a kojmyp kojmytyś∅ kojmytyśit
man myta nįk tə̄typytt-∅-a kojmy-p kojmyty-ś-∅ kojmyty-ś-it
я.NOM будто так шаманить-PRS-3.SG.SUB песня.SG-ACC петь-PST-3.SG.SUB петь-PST-3.SG.OB
Я вроде так (думала), шаманят, песню пел, пел.
2301:26 — 01:29
pūn paŋysä təp pärqalsyt
pūn paŋy-sä təp pärqal-s-yt
потом нож.SG-INS он/она/оно.NOM проткнуть-PST-3.SG.OB
Потом ножом он проткнул (себя){1}.
{1} Один из неоднократно описывавшихся в этнографической литературе (см., например, [Прокофьева 1981]) способов демонстрации шаманской силы.
2401:31 — 01:38
a mənyj qup pūn nymty nyny ponä missalsyt
a mənyj qup pūn nymty nyny ponä missal-s-yt
а чужой человек.SG.NOM потом тогда/там потом на.улицу выдернуть-PST-3.SG.OB
А другой человек там потом (нож) наружу вытащил.
2501:38 — 01:43
man nymDy kypa ɛ̄śaŋ
man nymDy kypa ɛ̄-ś-aŋ
я.NOM тогда/там маленький быть-PST-1.SG.SUB
Я тогда маленькая была,
2601:43 — 01:46
mat somaŋ mannympyśaŋ
mat somaŋ manny-mpy-ś-aŋ
я.NOM хорошо смотреть-DUR-PST-1.SG.SUB
я хорошо смотрела.
2701:46 — 01:49
a tonna tōtypyn{1} tə̄typyn muntyk kojmyttysɔ̄tyn pūt kojmyttysɔ̄tyn muntyk
a tonna tōtypy-n{1} tə̄typy-n muntyk kojmytty-s-ɔ̄tyn pūt kojmytty-s-ɔ̄tyn muntyk
а тот шаман.SLIP-PL.NOM шаман-PL.NOM весь Петь-PST-3.PL.SUB/OB потом петь-PST-3.PL.SUB/OB весь
А те шаманы, шаманы все пели потом, пели все.
{1} Оговорка рассказчицы, сразу же ею исправленная
2801:50 — 01:51
qutyj tymDy kə̄Zyn muntyŋ ɛ̄sɔ̄tyt təpytyn myqyn
qutyj tymDy kə̄Zy-n muntyŋ ɛ̄-s-ɔ̄tyt təpy-t-yn myqyn
передник.SG.NOM там железо-PL.NOM весь быть-PST-3.PL.SUB/OB он/она/оно-PL-GEN у
Передник{1}, там железки все были у них.
{1} Передник — деталь шаманского костюма, на которую нашивали железные изображения духов-помощников шамана.
2901:51 — 01:53
pēm'it aj tux nįľǮij kə̄sysä yľqyn munDyŋ mēBij
pēm'i-t aj tux nįľǮi-j kə̄sy-sä yľqyn munDyŋ mē-Bij
бокари-PL.NOM еще/и HES так-ADJ железо.SG-INS внизу весь сделать-ADJ.PST
По низу бокарей тоже железом все сделано.
3001:54 — 02:01
a təpyt nįľǯij tɛtamytyn
a təpy-t nįľǯij tɛtamy-tyn
а он/она/оно-PL.NOM такой вещи.COLL-POSS.3.PL
А они такие вещи!
3102:01 — 02:06
pūn na tə̄typyttį̄jsɔ̄tyn čelyj muqultįrij čēľy nįŋ sumBusɔ̄tyn{1}
pūn na tə̄typytt-į̄j-s-ɔ̄tyn čelyj muqultįrij čēľy nįŋ sumBu-s-ɔ̄tyn{1}
потом вот шаманить-INTS.DECS-PST-3.PL.SUB/OB целый целый день.SG.NOM так петь/шаманить-PST-3.PL.SUB/OB
Потом вот шаманы (вдоволь) нашаманились, целый, целый день так пели [=шаманили].
{1} Глагол sumpyqo 'петь, шаманить' используется для описания камлания в светлом чуме. Существует и другой вид камлания – в темном чуме – для описания которого используется другой глагол (qamytyrqo).
3202:06 — 02:11
ǖtyľlɔ̄qot tə̄typyľī{1} nyny munDyŋ ponä tanDylä munDyŋ kaŽdyj qum onDy mɔ̄tqynty moqonä qənqylʼisɔ̄tyn
ǖtyľlɔ̄qot tə̄typy-ľī{1} nyny munDyŋ ponä tanDy-lä munDyŋ kaŽdyj qum on-Dy mɔ̄t-qynty moqonä qən-qylʼi-s-ɔ̄tyn
к.вечеру шаман.SG.NOM-SLIP потом весь на.улицу выйти-CVB весь каждый человек.SG.NOM сам-3.SG дом/чум.SG-ILL.POSS.3.SG домой/назад уйти-PLSUB-PST-3.PL.SUB/OB
К вечеру шаманы потом все на улицу выйдя, все (каждый человек) в свой чум домой разошлись.
{1} Такой перевод формы дала рассказчица. Неясное окончание, возможно, просто оговорка рассказчицы
3302:11 — 02:14
sōm ɛ̄śit nymty
sōm ɛ̄-ś-it nymty
хорошо быть-PST-3.SG.OB тогда/там
Хорошо было там.
3402:18 — 02:24
mas{1} somaŋ mannympyśam
mas{1} somaŋ manny-mpy-ś-am
я.NOM хорошо смотреть-DUR-PST-1.SG.OB
Я хорошо смотрела.
{1} < mat
3502:25 — 02:36
mat kypʼi ɛ̄śaŋ nymty
mat kypʼi ɛ̄-ś-aŋ nymty
я.NOM маленький быть-PST-1.SG.SUB тогда
Я маленькая была.
3602:37 — 02:38
vot i vsio
vot i vsio
вот и все
Вот и все.
3702:38 — 02:39
ja maleńkaja byla vidʼela šamanskoje eto vsio
ja maleńkaja byla vidʼela šamanskoje eto vsio
я маленькая была видела шаманское это всё
Я маленькая была, видела шаманское это все.
Лингвист: А еще как Вас шаман вылечил (расскажите)?
3802:39 — 02:41
ā šamanto vyľ eto on
ā šaman=to vyľ eto on
а.а шаман=то SLIP это он
А-а шаман-то был... это он...
3902:41 — 02:42
а̄ təpyń ješʼo kogda šamaniľi ońi təpyń čattykkysɔ̄t niľǮį
а̄ təpy-ń ješʼo kogda šamaniľi ońi təpy-ń čatty-kky-s-ɔ̄t niľǮį
а.а он/она/оно-PL.NOM еще когда шаманили они он/она/оно-PL.NOM бросить-UST-PST-3.PL.SUB/OB такой
А-а они {шаманы} еще когда шаманили они они бросали такой...
4002:42 — 02:47
oj eto kak nazyvajetsʼato
oj eto kak nazyvajetsʼa=to
ой это как называется=то
Ой, это как называется-то?
Лингвист: qapšyn qapšyn (колотушка.бубна.SG.NOM колотушка.бубна.SG.NOM 'колотушка' 'колотушка')
4102:47 — 02:50
χʼapšyn tįľčįk čattykk∅ɔ̄Dyn
χʼapšyn tįľčįk čatty-kk-∅-ɔ̄Dyn
колотушка.бубна.SG.NOM так бросить-UST-PRS-3.PL.SUB/OB
Колотушка бубна, колотушка бубна.
4202:50 — 02:52
qum ɛ̄śa soma ɛsyqonDōqo ɛ̄śa qǖta∅ľ təp čattyk∅a nɔ̄qor raz čattyk∅a
qum ɛ̄-ś-a soma ɛsy-qo-nDōqo ɛ̄-ś-a qǖta-∅-ľ təp čatty-k-∅-a nɔ̄qor raz čatty-k-∅-a
человек.SG.NOM быть-PST-3.SG.SUB хороший стать-INF-POSS.3.SG быть-PST-3.SG.SUB болеть-PRS-2.SG.OB он/она/оно.SG.NOM бросить-UST-PRS-3.SG.SUB три раз бросить-UST-PRS-3.SG.SUB
Человек, бывало, (чтобы) поправиться ему [=хорошо стать ему], бывало, болеешь, он
4302:52 — 02:59
čattykojymByś mat pɛlǟqyn aj čattykojymByś nɔ̄qyrBɔ̄r čatt∅y
čatty-kojymBy-ś mat pɛlǟ-qyn aj čatty-kojymBy-ś nɔ̄qyr=Bɔ̄r čatt-∅-y
бросить-ITER-PST.3.SG.SUB я.GEN сторона.SG-LOC еще/и бросить-ITER-PST.3.SG.SUB три=раз.SG.NOM бросить-PRS-3.SG.SUB
Бросал, в мою сторону [=в моей стороне] тоже бросал, три раза бросил.
4403:00 — 03:02
mēlDy somyŋ aľčyk∅a
mēlDy somyŋ aľčy-k-∅-a
всегда хорошо упасть-UST-PRS-3.SG.SUB
Всегда [=всякий раз] хорошо падала (колотушка бубна).
4503:02 — 03:05
na pūn monty nįk kətyk∅ɔ̄tyn na ə̄ momBa iľɛnDaľ
na pūn monty nįk kəty-k-∅-ɔ̄tyn na ə̄ momBa iľ-ɛnD-aľ
вот потом видать так сказать-UST-PRS-3.PL.SUB/OB вот HES говорят жить-FUT-2.SG.OB
Вот потом, видать, так говорили вот э-э, говорят, жить будешь!
4603:05 — 03:07
vobšʼem eto nažyzń vobšʼem kʼidaľi vot eti vot šamanskij palku čtoľi ja neznaju [Конца фразы нет на аудио]
vobšʼem eto nažyzń vobšʼem kʼidaľi vot eti vot šamanskij palku čtoľi ja neznaju [Конца фразы нет на аудио]
в.общем это на.жизнь в.общем кидали вот эти вот шаманский палку что.ли я не.знаю [Конца фразы нет на аудио]
в общем это на жизнь, в общем кидали вот эти вот, шаманский, палку что ли, я не знаю! [Конца фразы нет на аудио]
Цитата: Цитатель от ноября 8, 2016, 06:35
А эти тексты уже упоминались, нет?
Три шамана. Л. А. Коганова
селькупский
http://minlang.srcc.msu.ru/ru/textspage
:stop: На этом сайте нет южноселькупских текстов. Говоры Турухана, Баихи и Елогуя относятся к северноселькупским, хотя географически они самые близкие к южному ареалу из всех северных, но контактов всё равно не было и нет почти никаких. Вот перевод начала того же текста на южноселькупский для сравнения (могу маленько перемешивать говоры, т.к. сам не натив и не селькуп :)).
Ми̇̄ Дындаӷыт варкымбавыт. Ны кет ӄуп Елогуйӷындо Дынданд тӧ̄мба. Таб Дынданд тӧ̄мба штоб ӄа̄дӭчугу. Най минан кетла варкымба. Ны Елогуйӷындо оккыр кет кадӭча тӧ̄мба. Вес кадӭчала оккыр ма̄тӄыт таӄӄылбат. Оккыр сусеӄой кадӭча, оккыр кетыль кадӭча, оккыр ӄве̄лумыль кадӭча. На̄гур кадӭчала.
Парадигма безличного склонения слов ӄуп(м) и сӯруп(м) из книги Беккер Э.Г., Алиткина Л.А., Быконя В.В., Ильяшенко И.А. Морфология селькупского языка. Южные диалекты. Часть I (http://www.twirpx.com/file/1958443/) (оригинал приложен).
В южноселькупском языке существительные с основами на -п и -м теряют этот согласный при склонении.
Говор: | Ср. Обь | Тым | Кеть | Верх. Обь |
родительный | -т | -т | -н | -ӭн |
винительный | -п | -п | -м | -м |
дательно- направительный I | -нд | - | - | -де |
дательно- направительный II | - | -н | -ни̇ | -ӷэ |
местно-личный | -нан, -ннан | - | -нан | -нан | |
местно- исходный | - | -нан, -ннан | - | - |
исходный | -нандо, -ннандо | - | -нанни̇ | -нанду |
исходно- продолжительный | - | -ут | - | - |
продолжительный | -ут, -утӭ | - | - | -мун, -ммун |
орудийно- совместный | -зэ | -зэ | -се | -сэ | лишительный | -галӭк | -галӭк | -галак | -галӭк | назначительно- превратительный | -тко | -тко | -ӈго | -но | превратительный | -вле | - | - | -ул |
|
Северный селькупский:
(1)Ман ни̇к тэнырпаӈ: (2) на куты ситты ӭ̄тысä мулымпа, (3) то пӯт сомаӈ мулэ̄итэнта. (4) Ны̄ны мӭный ӭ̄тым на эй сомаӈ ӱнтэ̄интыӈыт. (5) Куты ситты ӭ̄тысä мулымпылä, (6) ӄо̄ты чаӈак э̄йа. (7) Ме̄ ни̇к кӭткӧ̄мын: (8) ӄо̄ты чаӈак э̄йа. (9) Значит, сомак, сомак танымнэнта, (10) чӭк танымнэнта. (11) Ситты ӭ̄тып ӄуп ӄатамол ӱнтычэ̄ӈыты, (12) чӭӈ, ай чӭӈ ай тэныты койымӧ̄тка, (13) ӱро̄мынты койымӧ̄тка нäйэнты.
Шёшкупский (с):
(1) Мат ни̇к танык: (2) на код шэд шэзэ шарватпа, (3) то кате сва̄к шарватпэ̄нҗа, (4) кате таб арг ӭҗлап сва̄к коштынҗа. (5) Код шэд шэзэ шарватпа, (6) табнан сва̄ ӄола. (7) Ми ни̇к ченьчызавыт: (8) табнан сва̄ ӄола, (9) значит, сва̄к о̄ӷолалҗэнҗа, (10) тек о̄ӷолалҗэнҗа. (11) Ежли ӄуп шэд шэп коштымба, (12) тек, тек таныт лаӷӭрэ̄шпа, (13) кандук надӭ лаӷӭрэ̄шпа.
Русский:
(1) Я так думаю: (2) тот, кто говорит на двух языках, (3) то потом будет хорошо говорить, (4) потом он хорошо поймет чужие слова. (5) Кто говорит на двух языках, (6) у того чистые [не забитые ничем, мешающим услышать] уши. (7) Мы говорим так: (8) его уши чистые, (9) значит, он будет хорошо учиться, (10) быстро учиться будет. (11) Два языка человек если понял [услышал], (12) и быстро, быстро и его ум поворачивается [он быстро соображает], (13) по делу [как надо] поворачивается.
Источник: http://minlang.srcc.msu.ru/ru/text/pohvala-mnogoyazychiyu-yu-irikov
Ӄайӄо̄ коднай нынд шё̄шӄуй таре̄дык аза шарватпа?
Цитата: https://t.me/stranayaz/1006
на (южно)селькупском языке стали выходить видео на ютубе. если вам казалось, что на языке, на котором говорит всего несколько носителей, нельзя что-либо выпускать, его нельзя выучить, а ещё он очень сложный, хоть и самый древний, а кому это вообще надо
в общем вместо всей этой типичной мифологии просто нажмите на кнопку
Цитата: Krasimir от марта 24, 2017, 16:00
Северный селькупский:
Цитата: Krasimir от марта 24, 2017, 16:00
Шёшкупский
О боже, совершенно разные языки! Как их к одному народу-то отнесли?
Цитата: RockyRaccoon от февраля 9, 2021, 08:49
Цитата: Krasimir от марта 24, 2017, 16:00
Северный селькупский:
Цитата: Krasimir от марта 24, 2017, 16:00
Шёшкупский
О боже, совершенно разные языки! Как их к одному народу-то отнесли?
Конечно разные. Ничего общего. Взаимопонятность равна нулю. Вот официальный список языков России, подготовленный по госзаданию https://iyil2019.ru/issledovaniya/index.html где наконец-то 4 мансийских, 2 селькупских; кантыкский, хандэйский и хантыйский; также исправлены прочие косяки 20-х гг.
Просто смиритесь, селькупского языка не существует в природе уже более 300 лет.
Я когда-то читал, что селькупы и не считают себя единым народом, и называют себя по-разному. Зачем же их свалили в одну кучу? И кто свалил?
Цитата: RockyRaccoon от февраля 9, 2021, 09:06
Я когда-то читал, что селькупы и не считают себя единым народом, и называют себя по-разному. Зачем же их свалили в одну кучу? И кто свалил?
Свалили Прокофьевы в 20-е - 30-е. Селькупы живут двумя обособленными ареалами, там и материальная культура разная развилась со временем, на севере оленеводство развилось. Возможно, из-за массы самоназваний и свалили всех вместе, чтобы шибко не разбираться.
Цитата: Krasimir от февраля 9, 2021, 09:10
Свалили Прокофьевы в 20-е - 30-е.
Кто все эти Прокофьевы?
Ресурсы по языку.
Самая полная и постоянно пополняемая коллекция материалов лежит на Яндекс.Диске: https://disk.yandex.ru/d/who7mD_W3EaVbo - сейчас уже почти 3 Гб. Если у вас есть хоть небольшой интерес к языку, рекомендую скачать всю папку к себе на устройство или на свой яндекс.диск (это делается в один клик) - чем больше бэкапов, тем лучше.
Словарный бот по нарымскому диалекту:
https://t.me/selkup_words_bot
Также подключен в сообщениях группы ВК (https://vk.com/torova.lyagha1).
Не очень удобные в использовании, зато озвученные словари на портале Лингводок: http://lingvodoc.ispras.ru/dashboard/dictionaries_all
Больше текстов, чем на Яндекс.Диске, есть в корпусах:
http://lingvodoc.ispras.ru/corpora_all
https://inel.corpora.uni-hamburg.de/portal/community/selkup.php
И в википедии: https://incubator.wikimedia.org/wiki/Wp/sel/Варг_нагырбыдимы
Соцсети:
https://vk.com/torova.lyagha1
https://ok.ru/torova.lyagha
https://www.facebook.com/groups/torova.lyagha
Можно ещё мой новый твиттер упомянуть: https://twitter.com/kyrshkayuchejel
Можно ещё сделать, как камасинцы, пустой реддит, в дискорде активности нагнать, но пока не до того.
Видео:
YouTube, канал «Художник Юлия HARU-CHAN Селявко», плэйлист «Сохранение селькупской культуры»: https://www.youtube.com/watch?v=ID1b9esrka0&list=PL80XQm8lISUF_xQwf0eM4zitEZmI7220G (общее число просмотров: ~12503)
Одноклассники, группа «Шё̄шӄуй шэ̄ ✼ Чумӭл шэ ✼ Сӱ̄ссыӷӯй сэ̄», видео: https://ok.ru/torova.lyagha/video
Цитата: RockyRaccoon от февраля 9, 2021, 09:20
Цитата: Krasimir от февраля 9, 2021, 09:10
Свалили Прокофьевы в 20-е - 30-е.
Кто все эти Прокофьевы?
Одни из основателей селькуповедения.
https://selkup.fu-lab.ru/index.php/%D0%A2%D0%B5%D1%85%D0%BD%D0%BE%D0%A2%D0%B0%D0%B9%D0%B3%D0%B0