Лингвофорум

Теоретический раздел => Общая лингвистика => Тема начата: Mass от Сентября 23, 2019, 10:54

Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 10:54
На фоне полемики последних недель у меня медленно но верно назревал вопрос, который я, увы, не успел задать в соответствующей теме. Я попробую сделать это здесь, хотя он снова стал в моём уме немного бесформенным...

В любом случае есть название темы, и в её ключе есть что пообсуждать.
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 10:54
Вот есть умирающие языки, и есть их корпус текстов. У каких из них этот корпус достаточен для самостоятельного вхождения в реалии XXI века?

В той мере, чтоб можно было получить образование на условном удмуртском, и потом русский с английским нужны были только для общения и взаимодействия с юристами. А для понимания процессов в сфере деятельности они были не нужны.

Предлагали тут и собрания энтузиастов, и гранты со стороны государства, и нагнетание политики в тему.

А вот перевести на удмуртский стандарт C11 с полным и доступным комментарием для вхождения с ноля, сделать поддерживающий все его функции компилятор, и обеспечить себе пару тысяч новых носителей - никто не предложил. (Заодно можно к этому талмуду лучшее из удмуртской литературы отдельной хрестоматией давать. Прочтут. И я не шучу. Такие вот они маргиналы, те кто нуждается в Си)
Название: Умирающие языки и корпус текстов
Отправлено: Krasimir от Сентября 23, 2019, 11:31
У языков традиционных сообществ этот корпус явно недостаточен. В таком случае уже идёт речь о расширении функциональных сфер языка путём рукотворного внесения инноваций. Кодификация языков и создание литературных норм - схожее действие.
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 11:48
Krasimir, добивайтесь при этом минимального внесения инноваций.

Вы при этом убъёте сразу двух зайцев - текст будет понятен людям с любой степенью образования, не так ли? А язык будет востребован и жив.
Название: Умирающие языки и корпус текстов
Отправлено: Krasimir от Сентября 23, 2019, 11:49
Безусловно, ведь если уйти в чистое конлангерство, носители языка просто не поймут написанного/сказанного.
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 11:51
А если умудриться при полноценном, эффективном комментировании уйти от неологизмов на 97%, получится описание одного из корявейших стандартов, понятное любой пенсионерке. Что и необходимо.
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 11:53
Почему я выбрал этот стандарт для примера - в программировании сейчас такая "гонка вооружений", что ни на английском ни на русском такого труда не будет 100%.

И такие ниши есть не только в программировании.
Название: Умирающие языки и корпус текстов
Отправлено: Flos от Сентября 23, 2019, 12:10
А вот перевести на удмуртский стандарт C11 с полным и доступным комментарием для вхождения с ноля, сделать поддерживающий все его функции компилятор, и обеспечить себе пару тысяч новых носителей -

Переведите для начала Ваше сообщение с программистского на какой-нибудь человеческий.

;)
Название: Умирающие языки и корпус текстов
Отправлено: Rōmānus от Сентября 23, 2019, 12:11
Вот есть умирающие языки, и есть их корпус текстов. У каких из них этот корпус достаточен для самостоятельного вхождения в реалии XXI века?
Ни у одного, так как "умирающий язык" по определению - язык с сильно ограниченной функциональностью. Если он не был бы с ограниченной функциональностью, то он не был бы "умирающим".

Цитировать
Предлагали тут и собрания энтузиастов
А зачем так беспардонно передёргивать? "Собрания энтузиастов" - это было по теме организования образования по инициативе снизу. Причём тут технологическая терминология?
Цитировать
А вот перевести на удмуртский стандарт C11 с полным и доступным комментарием
Зачем переводить стандарт языка программирования на язык, в котором даже нет своих терминов для "компьютер", "клавиатура", "экран" и т.д.? Любой такой перевод по умолчанию будет текстом на русском (хотя "компьютер", "клавиатура", "экран" - тоже условно русские слова, но хотя бы были грамматически адаптированы) с удмуртскими окончаниями.

Цитировать
обеспечить себе пару тысяч новых носителей
Не вижу логической связи. Как перевод какой-то техногенной бумаги сам по себе "обеспечивает пару тысяч новых носителей"?


Чисто по теме (в общем): зачем изобретать велосипед. Есть успешный опыт возрождения языков из ситуации вроде удмуртского - деревенский язык с ограниченной функциональностью. На ум приходят финский, чешский и прибалтийские языки. Ни в одном случае не обошлось без какого-то централизованного органа, который занимался бы разработкой новой терминологии, чтобы язык не был похож на "колхозникат радужно играюот на лугазелла" (почти точная цитата из учебник по карельскому). Одни термины приживутся, другие нет, но у языка появится какая-то динамика. Необязательно разрабатывать неологизмы от балды, часто хватает правильно адаптировать заимствование, чтобы оно не ломало фонологию и грамматику языка. Иногда помогает хорошая лексикографическая работа - воскрешение устаревших или редких слов с новым значением. Да и в неологизмах нет ничего плохого, если они по продуктивным моделям. Компьютер по-ирландски ríomhaire "счетовод" - как-то слово прижилось сразу, без проблем. А вот компактдиск (CD) в виде dlúthdhiosca нет, людям больше нравится си-ди.

А насчёт того. что условная бурановская бабушка не поймёт стандарт Си из-за неологизмов - так она его в любом случае не поймёт, на каком языке он ни был бы написан. По её части больше традиционные рецепты.
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 12:14
Переведите для начала Ваше сообщение с программистского на человеческий.

;)

Вот здесь - (wiki/ru) Спецификация_языков_программирования (https://ru.wikipedia.org/wiki/%D0%A1%D0%BF%D0%B5%D1%86%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D1%8F_%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F)

Со стандартом C11 сложность ещё и в том, что когда его смогли оформить, взлетело огромнейшее количество других языков программирования, и он как бы "завис в воздухе". Сейчас даже нет ни одного компиллятора, который полностью бы поддерживал всё, что описано в этом стандарте.
Название: Умирающие языки и корпус текстов
Отправлено: Flos от Сентября 23, 2019, 12:14
И такие ниши есть не только в программировании.

Зарулить чувашу куда-нить в Индонезию. И составить подробные грамматики всех редких языков в 20-ти томах. Со сказками и легендами.
 И все на чувашском.

 :smoke:
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 12:16
И такие ниши есть не только в программировании.

Зарулить чувашу куда-нить в Индонезию. И составить подробные грамматики всех редких языков в 20-ти томах. Со сказками и легендами.
 И все на чувашском.

 :smoke:
В каждой шутке есть доля шутки. Это ж реально, если найдётся достаточное количество образованных чувашей.
Название: Умирающие языки и корпус текстов
Отправлено: Flos от Сентября 23, 2019, 12:16
В каждой шутке есть доля шутки. Это ж реально, если найдётся достаточное количество образованных чувашей.

Конечно. Действительно, это "ниша".
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 12:17
Rōmānus, не, с "ограниченной функциональностью" это неприемлемо.

Способность к выживанию и развитию прямо кореллирует с внутривидовым разнообразием.
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 12:18
А насчёт того. что условная бурановская бабушка не поймёт стандарт Си из-за неологизмов - так она его в любом случае не поймёт, на каком языке он ни был бы написан. По её части больше традиционные рецепты.
"Вы себе не представляете, на что способны бабушки" ©
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 12:25
Цитировать
обеспечить себе пару тысяч новых носителей
Не вижу логической связи. Как перевод какой-то техногенной бумаги сам по себе "обеспечивает пару тысяч новых носителей"?
Опять выбросили значимый кусок. Я ж указал, что крайне важны именно комментарии. Если перед программистом станет вопрос о двух вариантах:

1. стандарт и сопровождение на английском, но без указаний на тысячу критичных тонкостей, и без возможности дать джуниору в зубы мануал.
2. выучить удмуртский, заставить джуниора выучить его тоже, и получить всё необходимое "из коробки".

То большинство выберет второй вариант.

Название: Умирающие языки и корпус текстов
Отправлено: Rōmānus от Сентября 23, 2019, 12:42
Цитировать
обеспечить себе пару тысяч новых носителей
Не вижу логической связи. Как перевод какой-то техногенной бумаги сам по себе "обеспечивает пару тысяч новых носителей"?
Опять выбросили значимый кусок. Я ж указал, что крайне важны именно комментарии. Если перед программистом станет вопрос о двух вариантах:

1. стандарт и сопровождение на английском, но без указаний на тысячу критичных тонкостей, и без возможности дать джуниору в зубы мануал.
2. выучить удмуртский, заставить джуниора выучить его тоже, и получить всё необходимое "из коробки".

То большинство выберет второй вариант.


Программист, которому лень учить английский, но который не только сам, но и дитя своё сподвигнет на изучение удмуртского? Прямо сценарий для постапокалиптической антиутопии. Надо Тому Крузу предложить :pop:
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 12:45
Опять выбросили значимый кусок. Я ж указал, что крайне важны именно комментарии. Если перед программистом станет вопрос о двух вариантах:

1. стандарт и сопровождение на английском, но без указаний на тысячу критичных тонкостей, и без возможности дать джуниору в зубы мануал.
2. выучить удмуртский, заставить джуниора выучить его тоже, и получить всё необходимое "из коробки".

То большинство выберет второй вариант.
Программист, которому лень учить английский, но который не только сам, но и дитя своё сподвигнет на изучение удмуртского? Прямо сценарий для постапокалиптической антиутопии. Надо Тому Крузу предложить :pop:
Вы сейчас, после моего замечания о том, что вы даже не знаете кто такой "джуниор" и лезете в тему, в которой некомпетентны...

Резко станете знать и станете компетентнее, верно? Ну, это тоже просветительская польза польза от темы, всё хорошо.
Название: Умирающие языки и корпус текстов
Отправлено: Rōmānus от Сентября 23, 2019, 12:58
Опять выбросили значимый кусок. Я ж указал, что крайне важны именно комментарии. Если перед программистом станет вопрос о двух вариантах:

1. стандарт и сопровождение на английском, но без указаний на тысячу критичных тонкостей, и без возможности дать джуниору в зубы мануал.
2. выучить удмуртский, заставить джуниора выучить его тоже, и получить всё необходимое "из коробки".

То большинство выберет второй вариант.
Программист, которому лень учить английский, но который не только сам, но и дитя своё сподвигнет на изучение удмуртского? Прямо сценарий для постапокалиптической антиутопии. Надо Тому Крузу предложить :pop:
Вы сейчас, после моего замечания о том, что вы даже не знаете кто такой "джуниор" и лезете в тему, в которой некомпетентны...

Резко станете знать и станете компетентнее, верно? Ну, это тоже просветительская польза польза от темы, всё хорошо.

Вы вот со мной вроде на русском общаетесь, и я как-то не жалуюсь на свои познания в русском языке. Выясняется, что я "некомпетентен", потому что я не понимают ваше технологическое бла-бла-бла. А теперь представьте бурановскую бабушку на лавочке, а вы к ней подкатываете со своим бла-бла-бла. Представили? Ну и какие у этой бабушки шансы понять, что вы говорите, хоть по-удмуртски, хоть по-русски, хоть по-английски?

А выяснять, хто такой "джуниор" не собираюсь, потому что я знаю, что мне этого на 100% не надо. Не моя сфера, и никогда не будет. Зря потраченное время
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 13:02
Выясняется, что я "некомпетентен", потому что я не понимают ваше технологическое бла-бла-бла.
Но при этом имитируете охват вашим умищем темы от начала и до конца, и высказываете саркастическое суждение о бессмысленности того, чего вы не понимаете. И не поправляетесь, когда вам на это укажут.

Вот она, "воинствующая некомпетентность", которую вы же и не одобряете :green:
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 13:05
А теперь представьте бурановскую бабушку на лавочке, а вы к ней подкатываете со своим бла-бла-бла. Представили? Ну и какие у этой бабушки шансы понять, что вы говорите, хоть по-удмуртски, хоть по-русски, хоть по-английски?
С нормальным мануалом, да за пол-года шансы значительны.

Вы себе не представляете, сколько бабушек и дедушек в World of Warcraft водили рейды и учили всех макросы писать, стоило им таки довести азы этого дела :E:
Название: Умирающие языки и корпус текстов
Отправлено: Rōmānus от Сентября 23, 2019, 13:33
Выясняется, что я "некомпетентен", потому что я не понимают ваше технологическое бла-бла-бла.
Но при этом имитируете охват вашим умищем темы от начала и до конца, и высказываете саркастическое суждение о бессмысленности того, чего вы не понимаете. И не поправляетесь, когда вам на это укажут.

Вот она, "воинствующая некомпетентность", которую вы же и не одобряете :green:
Вы извините, что сейчас вас немного поставлю на место, но в языковых вопросах и вопросах языкового строительства для миноритетных языков я буду покомпетентнее вас. А Си или Си-плюс-плюс мне не интересен, да и к теме обсуждения они мало относятся.
Название: Умирающие языки и корпус текстов
Отправлено: Rōmānus от Сентября 23, 2019, 13:34
А теперь представьте бурановскую бабушку на лавочке, а вы к ней подкатываете со своим бла-бла-бла. Представили? Ну и какие у этой бабушки шансы понять, что вы говорите, хоть по-удмуртски, хоть по-русски, хоть по-английски?
С нормальным мануалом, да за пол-года шансы значительны.

Вы себе не представляете, сколько бабушек и дедушек в World of Warcraft водили рейды и учили всех макросы писать, стоило им таки довести азы этого дела :E:
Какая разница - играть в компьютерные игры или писать техническую документацию по программирования. Общеизвестно же, что рыба - лучший ихтиолог :pop:
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 13:42
Вы извините, что сейчас вас немного поставлю на место,

У вас не вышло.

но в языковых вопросах

Не факт.

и вопросах языкового строительства для миноритетных языков

Не вижу от вас мало-мальски общей теории процесса, только описание двух конкретных случаев.

А Си или Си-плюс-плюс мне не интересен, да и к теме обсуждения они мало относятся.
Совсем охамел человек...

Какая разница - играть в компьютерные игры или писать техническую документацию по программирования. Общеизвестно же, что рыба - лучший ихтиолог :pop:
Эт  у вас универсалия, или к ней огромный комплекс остальных локально ваших представлений прилагается?
Название: Умирающие языки и корпус текстов
Отправлено: Rōmānus от Сентября 23, 2019, 13:43
Вам ссылку на статью Сарказм в википедии кинуть?
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 13:45
Вам ссылку на статью Сарказм в википедии кинуть?
А у вас кроме сарказма что-то будет? Если нет, то прекращайте флудить в этой теме, мне интересна именно она а не вы.
Название: Умирающие языки и корпус текстов
Отправлено: Python от Сентября 23, 2019, 15:44
Не очень понятно, почему в контексте языков программирования мы рассматриваем удмуртских бабушек, а не удмуртских школьников (представим, что удмуртский учить в школах все еще не запрещено), мечтающих выучиться на программиста и, например, зарабатывать фрилансом по сети, не выезжая из родной деревни.
Как может выглядеть обучение удмуртского программиста сейчас:
1) Надо забить на удмуртский язык (он все равно только для традиционного песнопения и разговоров на кухне пригоден), а все усилия вложить в русский и английский, на которых имеется годная информация по специальности.
2) Пользуясь доступностью русского, по максимуму освоить техническую литературу на нем, параллельно подтягивая технический английский.
3) Расширять познания, пользуясь англоязычными источниками.

Как было бы, будь у него полноценная техническая литература на родном языке:
1) Освоить по максимуму техническую литературу на удмуртском, параллельно подтягивая технический английский.
2) Расширять познания, пользуясь англоязычными источниками.

Вариант «сразу забить на родной и русский, а учить английский», можно отбросить: на начальном этапе это лишь усложнит восприятие специфической информации на специфическом профессиональном языке, который лишь частично соприкасается с туристической лексикой типичного школьного английского.
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 15:45
Переведите для начала Ваше сообщение с программистского на какой-нибудь человеческий.
Наверное, попробую сам. "Стандарт" это оформленная ввиде единого документа детальная модель языка программирования. Там указаны все свойства каждой команды и правила взаимодействия между ними.

Математически полное описание абсолютно всего языка, если так удобнее.

Разработчики компиллятора этого языка, коий превращает текст программы в исполняемые файлы, обязаны сделать его соответствующим этому документу. Они могут не включать все его пункты полностью, могут в большинстве случаев добавлять свои (!), но не могут вносить функционал, противоречащий стандарту.

В результате языки развиваются, и потом, собравшись вместе, программисты пытаются собрать в кучу результаты этого развития. Выводя следующий "стандарт". Беда в том, что компилляторы нового стандарта должны поддерживать "легаси". Устаревшие программы предыдущего стандарта должны компиллироваться на новом, во имя стабильности и поддержки.

Каждый новый стандарт обычно головоломнее предыдущего на порядок. И редко кто выпускает адекватный ликбез, понятный новичку. Редки даже ликбезы для владеющих предыдущей версией, если честно  ;D
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 15:47
Не очень понятно, почему в контексте языков программирования мы рассматриваем удмуртских бабушек, а не удмуртских школьников
Бабушек ввёл топикстартер, подразумевая что если осилит каждая третья бабушка, то осилит любой школьник.
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 15:49
Как было бы, будь у него полноценная техническая литература на родном языке:
1) Освоить по максимуму техническую литературу на удмуртском, параллельно подтягивая технический английский.
2) Расширять познания, пользуясь англоязычными источниками.
А я об этом и говорю. Русское комьюнити сильнó, так что я б к англоязычным добавил и русскоязычные.
Название: Умирающие языки и корпус текстов
Отправлено: Mass от Сентября 23, 2019, 15:56
К тому же, с удмуртским (и любым другим) языком можно здесь делать мощные прорывы в сферу деятельности, выпуская высококачественные "ликбезы" по тем сферам, где накопилось легаси.