Цитата: Алексей Гринь от января 9, 2011, 22:00
Помимо фонетики внезапно есть лексика
Кстати, а какой процент занимает в английском чиста германская лексика?
Небольшой, скажем прямо. В учебник лезть лень.
Цитата: myst от января 9, 2011, 22:04
ЦитироватьПомимо фонетики внезапно есть лексика
Кстати, а какой процент занимает в английском чиста германская лексика?
Процент в словаре или процент в тексте? В словаре где-то около 30%. В живом тексте очень много, сильно превышая половину, вроде где-то 80%.
ЦитироватьПомимо фонетики внезапно есть лексика
Из пяти русских слов два есть в украинском и английском, одно присутствует в украинском как малоиспользуемое и два есть лишь в русском. Гипотеза о (велико)русском как пжэдке украинского не подтвеждзилась? Или восточнославянские — это диалекты английского, испорченные польским?
Цитата: Karakurt от января 9, 2011, 22:11
Цитировать80%
Да ну?!
Думаете больше? От регистра зависит. Чем мудрее и научнее, тем больше латино-жабоядных слов.
По теме: (wiki/en) English_language#Word_origins (http://en.wikipedia.org/wiki/English_language#Word_origins)
Думаю меньше. Смотря еще как считать. Предлоги считать?
Цитата: Karakurt от января 9, 2011, 22:23
Думаю меньше. Смотря еще как считать. Предлоги считать?
А что, предлоги не слова?
Можно считать по-разному и привести все варианты. ИМХО, в сказке для детей будет более 90% германской лексики.
Цитата: http://ivyjoy.com/fables/lionskin.htmlThe Ass in the Lion's Skin
An Ass once found a Lion's skin which the hunters had left out in the sun to dry. He put it on and went towards his native village. All fled at his approach, both men and animals, and he was a proud Ass that day. In his delight he lifted up his voice and brayed, but then every one knew him, and his owner came up and gave him a sound cudgelling for the fright he had caused. And shortly afterwards a Fox came up to him and said: "Ah, I knew you by your voice."
Болдом негерманское. Что я пропустил?
delight, lion, proud, bray.
caused.
И о чём говорят проценты лексики? Нгати будет негодовать. :green:
С Вами проценты разговаривают? (Участливо)
А если скандинавизмы посчитать? Ибо заимствования.
Цитата: RawonaM от января 9, 2011, 22:31
Болдом негерманское. Что я пропустил?
Вы пропустили delight (внезапно!), brayed, caused.
Lift (up) - конечно, германизм, только скандинавского происхождения.
Ass же, напротив, из староанглийского, но германизмом не является.
P.S.: Ну да, и lion c proud, конечно (последнее - тоже раннее заимствование).
Цитата: Karakurt от января 9, 2011, 22:43
А если скандинавизмы посчитать? Ибо заимствования.
Так это же тоже германцы.
Цитата: Awwal12 от января 9, 2011, 22:43
Lift (up) - конечно, германизм, только скандинавского происхождения.
Skin тоже.
Заапдейтил с учетом комментариев. Посчитаем.
Цитата: Karakurt от января 9, 2011, 22:43
А если скандинавизмы посчитать?
А из каких регионов Скандинавии они приплыли? Скандинавия таки большая. :what:
Блин, как же я appoach-то не заметил! :wall:
Цитата: myst от января 9, 2011, 22:44
Цитата: Karakurt от января 9, 2011, 22:43
А если скандинавизмы посчитать? Ибо заимствования.
Так это же тоже германцы.
Все равно, не исконна же.
102 слова, 12 жабоизмы.
Цитата: RawonaMЗаапдейтил с учетом комментариев.
bray не проапдейтил.
Почти 12%.
Цитата: RawonaM от января 9, 2011, 22:49
102 слова, 12 жабоизмы.
Чем слова считаешь?
Цитата: Karakurt от января 9, 2011, 22:47
ЦитироватьЦитироватьА если скандинавизмы посчитать? Ибо заимствования.
Так это же тоже германцы.
Все равно, не исконна же.
А исконность у вас с какого века считается? Все что в олдинглише уже исконное? Или только то, что проследить невозможно?
Цитата: μύστηςЧем слова считаешь?
Скорее «что словами считаешь?».
Цитата: myst от января 9, 2011, 22:50
Цитировать102 слова, 12 жабоизмы.
Чем слова считаешь?
wc. Она нормально считает?
Цитата: RawonaM от января 9, 2011, 22:51
wc. Она нормально считает?
Я уже забыл, что она считает. У меня awk головного мозга. :)
Надо не так сделать. Берём первую сотню самых частотных слов и смотрим. Потом вторую. Потом... впрочем, ну его нафик, хватит и двух сотен.
Цитата: RawonaM от января 9, 2011, 22:50
А исконность у вас с какого века считается?
Предлагаю считать исконно английской только ту лексику, что приплыла с Хенгистом и Хорсой, но никак не позже. :uzhos:
Цитата: Bhudh от января 9, 2011, 22:49
ЦитироватьЗаапдейтил с учетом комментариев.
bray не проапдейтил.
Пардон.
Ну в общем, на таком маленьком тесте статистику не делают в любом случае, но дело ясное, что процент не более 20 стопудово. Чем "взрослее" текст, тем процент будет увеличиваться.
Списки у меня есть. Кто возьмётся? :)
Цитата: myst от января 9, 2011, 22:53
Надо не так сделать. Берём первую сотню самых частотных слов и смотрим. Потом вторую. Потом... впрочем, ну его нафик.
С педии:
Source of the most frequent 7,476 English words
1st 100 1st 1,000 2nd 1,000 then on
Germanic 97% 57% 39% 36%
Italic 3% 36% 51% 51%
Hellenic 0 4% 4% 7%
Others 0 3% 6% 6%
Цитата: is a data driven programming language designed for processing text-based data, either in files or data streams. It is an example of a programming language that extensively uses the string datatype, associative arrays (that is, arrays indexed by key strings), and regular expressions.
AWK is one of the early tools to appear in Version 7 Unix and gained popularity as a way to add computational features to a Unix pipeline. A version of the AWK language is a standard feature of nearly every modern Unix-like operating system available today. AWK is mentioned in the Single UNIX Specification as one of the mandatory utilities of a Unix operating system. Besides the Bourne shell, AWK is the only other scripting language available in a standard Unix environment. It is also present amongst the commands required by the Linux Standard Base specification. Implementations of AWK exist as installed software for almost all other operating systems.
AWK was created at Bell Labs in the 1970s, and its name is derived from the family names of its authors — Alfred Aho, Peter Weinberger, and Brian Kernighan. The name is not commonly pronounced as a string of separate letters but rather to sound the same as the name of the bird, auk (which acts as an emblem of the language such as on The AWK Programming Language book cover - the book is often referred to by the abbreviation TAPL). awk, when written in all lowercase letters, refers to the Unix or Plan 9 program that runs other programs written in the AWK programming language.
The power, terseness, and limitations of early AWK programs inspired Larry Wall to write Perl just as a new, more powerful POSIX AWK and gawk (GNU AWK) were being defined. Although AWK and sed were designed to support one-liner programs, even the early Bell Labs users of AWK often wrote well-structured large AWK programs.
AWK is Turing-complete.
Structure of AWK programs
"AWK is a language for processing files of text. A file is treated as a sequence of records, and by default each line is a record. Each line is broken up into a sequence of fields, so we can think of the first word in a line as the first field, the second word as the second field, and so on. An AWK program is of a sequence of pattern-action statements. AWK reads the input a line at a time. A line is scanned for each pattern in the program, and for each pattern that matches, the associated action is executed." - Alfred V. Aho
An AWK program is a series of pattern action pairs, written as:
condition { action }
where condition is typically an expression and action is a series of commands. The input is split into records, where by default records are separated by newline characters so that the input is split into lines. The program tests each record against each of the conditions in turn, and executes the action for each expression that is true. Either the condition or the action may be omitted. The condition defaults to matching every record. The default action is to print the record.
In addition to a simple AWK expression, such as foo == 1 or /^foo/, the condition can be BEGIN or END causing the action to be executed before or after all records have been read, or pattern1, pattern2 which matches the range of records starting with a record that matches pattern1 up to and including the record that matches pattern2 before again trying to match against pattern1 on future lines.
In addition to normal arithmetic and logical operators, AWK expressions include the tilde operator, ~, which matches a regular expression against a string. As handy syntactic sugar, /regexp/ without using the tilde operator matches against the current record.
AWK commands
AWK commands are the statement that is substituted for action in the examples above. AWK commands can include function calls, variable assignments, calculations, or any combination thereof. AWK contains built-in support for many functions; many more are provided by the various flavors of AWK. Also, some flavors support the inclusion of dynamically linked libraries, which can also provide more functions.
For brevity, the enclosing curly braces ( { } ) will be omitted from these examples.
Цитата: myst от января 9, 2011, 22:54
Списки у меня есть. Кто возьмётся? :)
А что там браться? В NLTK закинул, он всю статистику по-взрослому умеет. Да и закидывать не надо, у него все есть. Только не знаю, проставлены ли жабоизмы.
Обожаю Интернет: в нём почти всё уже сделано до нас. (Веб-сервер задолбал уже рвать соединения! Только с пятого раза запостил. :wall:)
Цитата: Bhudh от января 9, 2011, 22:56
Цитата: is a data driven programming language designed for processing text-based data, either in files or data streams. It is an example of a programming language that extensively uses the string datatype, associative arrays (that is, arrays indexed by key strings), and regular expressions.
AWK is one of the early tools to appear in Version 7 Unix and gained popularity as a way to add computational features to a Unix pipeline. A version of the AWK language is a standard feature of nearly every modern Unix-like operating system available today. AWK is mentioned in the Single UNIX Specification as one of the mandatory utilities of a Unix operating system. Besides the Bourne shell, AWK is the only other scripting language available in a standard Unix environment. It is also present amongst the commands required by the Linux Standard Base specification. Implementations of AWK exist as installed software for almost all other operating systems.
AWK was created at Bell Labs in the 1970s, and its name is derived from the family names of its authors — Alfred Aho, Peter Weinberger, and Brian Kernighan. The name is not commonly pronounced as a string of separate letters but rather to sound the same as the name of the bird, auk (which acts as an emblem of the language such as on The AWK Programming Language book cover - the book is often referred to by the abbreviation TAPL). awk, when written in all lowercase letters, refers to the Unix or Plan 9 program that runs other programs written in the AWK programming language.
The power, terseness, and limitations of early AWK programs inspired Larry Wall to write Perl just as a new, more powerful POSIX AWK and gawk (GNU AWK) were being defined. Although AWK and sed were designed to support one-liner programs, even the early Bell Labs users of AWK often wrote well-structured large AWK programs.
AWK is Turing-complete.
Structure of AWK programs
"AWK is a language for processing files of text. A file is treated as a sequence of records, and by default each line is a record. Each line is broken up into a sequence of fields, so we can think of the first word in a line as the first field, the second word as the second field, and so on. An AWK program is of a sequence of pattern-action statements. AWK reads the input a line at a time. A line is scanned for each pattern in the program, and for each pattern that matches, the associated action is executed." - Alfred V. Aho
An AWK program is a series of pattern action pairs, written as:
condition { action }
where condition is typically an expression and action is a series of commands. The input is split into records, where by default records are separated by newline characters so that the input is split into lines. The program tests each record against each of the conditions in turn, and executes the action for each expression that is true. Either the condition or the action may be omitted. The condition defaults to matching every record. The default action is to print the record.
In addition to a simple AWK expression, such as foo == 1 or /^foo/, the condition can be BEGIN or END causing the action to be executed before or after all records have been read, or pattern1, pattern2 which matches the range of records starting with a record that matches pattern1 up to and including the record that matches pattern2 before again trying to match against pattern1 on future lines.
In addition to normal arithmetic and logical operators, AWK expressions include the tilde operator, ~, which matches a regular expression against a string. As handy syntactic sugar, /regexp/ without using the tilde operator matches against the current record.
AWK commands
AWK commands are the statement that is substituted for action in the examples above. AWK commands can include function calls, variable assignments, calculations, or any combination thereof. AWK contains built-in support for many functions; many more are provided by the various flavors of AWK. Also, some flavors support the inclusion of dynamically linked libraries, which can also provide more functions.
For brevity, the enclosing curly braces ( { } ) will be omitted from these examples.
:??? Ты кэпом в ночь подрабатываешь?
А уже ночь⁈ А-а-а! И правда!
А некоторые-то не знают...
И я не знал.
Странные люди.
А dish, cook, inch считаются?
Цитата: RawonaM от января 9, 2011, 22:55
С педии:
Чтоб читалось удобнее:
Source of the most frequent 7,476 English words
| 1st 100 | 1st 1,000 | 2nd 1,000 | then on |
Germanic | 97% | 57% | 39% | 36% |
Italic | 3% | 36% | 51% | 51% |
Hellenic | 0 | 4% | 4% | 7% |
Others | 0 | 3% | 6% | 6% |
Цитата: Хворост от января 10, 2011, 11:53
А dish, cook, inch считаются?
Если принять предложение:
Цитата: Невский чукчо от января 9, 2011, 22:53
Предлагаю считать исконно английской только ту лексику, что приплыла с Хенгистом и Хорсой, но никак не позже.
то считаются германскими, кроме inch.
таки срач глуповат.
берете данные корпуса английского языка и радуетесь, как не поглядишь все тут лексикостатисты. епт.
Цитата: Aleksey от января 10, 2011, 13:28
таки срач глуповат.
Во-первых, здесь нет никакого срача.
Цитата: Aleksey от января 10, 2011, 13:28
берете данные корпуса английского языка и радуетесь, как не поглядишь все тут лексикостатисты. епт.
Во-вторых, если у Вас есть какие-то дополнительные сведения, приводите. Пустое балабольство здесь никому не интересно.
Цитата: myst от января 10, 2011, 13:45
Во-вторых, если у Вас есть какие-то дополнительные сведения, приводите. Пустое балабольство здесь никому не интересно.
был бы рад, но в основном данные корпуса небесплатные..
Надо считать исконно английскими только те слова, которые предсказываются методом сравнительного языкознания. Все остальные - не считово.
Цитата: RawonaM от января 9, 2011, 22:55
Italic 3% 36% 51% 51%
Это чё имеется ввиду? :what:
Латынь и френч вестимо.
Я думал, что Italic - это итальянский, потому и удивился.
Цитата: RawonaM от января 9, 2011, 22:49
102 слова, 12 жабоизмы.
Статистика шибко разжижается артиклями, так нечестно
Цитата: Алексей Гринь от января 12, 2011, 00:17
Цитировать102 слова, 12 жабоизмы.
Статистика шибко разжижается артиклями, так нечестно
Артикли не слова? Мы ж текст считаем, а не словарь.
Посчитай без артиклей, нам тоже интересно.
Цитата: злой от января 11, 2011, 09:50
Надо считать исконно английскими только те слова, которые предсказываются методом сравнительного языкознания. Все остальные - не считово.
Что за метод?
Цитата: Andrei N от января 12, 2011, 08:36
Цитата: злой от января 11, 2011, 09:50
Надо считать исконно английскими только те слова, которые предсказываются методом сравнительного языкознания. Все остальные - не считово.
Что за метод?
Ну, отсеять всякие скандинавизмы и заимствования из немецкого.
Цитата: злой от января 12, 2011, 14:13
Ну, отсеять всякие скандинавизмы и заимствования из немецкого.
Предлааю отсеять все слова. :eat:
А заимствованные суффиксы не считаете? :donno:
Отсеять заимствованные буквы — и дело с концом!
Почему буквы? Фонемы.
В русском ф, фь заимствованны, суфикс ист. Хорошо бы и для англа найти более подробную таблицу заимствований. Не слов, а морфем.
Полангла.
Цитата: Валентин Н от января 26, 2011, 22:47
В русском ф, фь заимствованны
Да, особенно в окончании -ов и в слове кровь например.
Цитата: Валентин Н от января 26, 2011, 22:47
В русском ф, фь заимствованны
Чозабред? Фтопку!
русский язык появился в 17 веке и у него уже всё было.
Цитата: lehoslav от января 26, 2011, 23:08
Да, особенно в окончании -ов и в слове кровь например.
я про фонэмы
Цитата: Валентин Н от января 27, 2011, 13:09
я про фонэмы
Дык по ЛФШ здесь /f/, /fʲ/.
В -ов по-вашему в конце какая фонема? /v/? Доказательствами побалуете?
Цитата: lehoslav от января 27, 2011, 13:36
В -ов по-вашему в конце какая фонема? /v/? Доказательствами побалуете?
крова, крови :donno:
Цитата: Валентин Н от января 27, 2011, 13:45
крова, крови
Ы? Я об окончании -ов, об окончании родительного падежа множ. числа сущ.
А что говорит диахрония? :negozhe:
Цитата: Валентин Н от января 27, 2011, 14:22
А что говорит диахрония?
Она говорит что окончание -ов заимствовано? :eat:
Цитата: lehoslav от января 27, 2011, 14:29
Она говорит что окончание -ов заимствовано?
Она грит, что там было -овъ.
Луи!
Где там ф?!
А СЄНЧѦСЪ ТАМО ЧЬТО?
а санчасть там ВЭ же
Цитата: Валентин Н от января 27, 2011, 18:59
Луи!
Где там ф?!
Диахрония нам говорит, что там раньше было *-ou̯-ŏm
Где там в?!
ну вот значит там М, где там ф?
Ф там появилось не раньше, чем В огубнозубнело.
Цитата: http://www.kvatross.ru/sonic-phenomena/652.htmlнаписание ф на месте в наблюдается только с XVI в.
Вот видите какой бред выходит!
Вы не тот звук увидели.
-ou̯-ŏm > -ов-ъø.
Цитата: Bhudh от января 27, 2011, 19:40
Вы не тот звук увидели.
Валентин это наш спицыализд по фонологии :eat:
Да ладно вам, лучшеб привели доказательство существования Ф
Как буква Ф называется?
Цитата: lehoslav от января 27, 2011, 20:28
Валентин это наш спицыализд по фонологии :eat:
Он универсал (компакт). :eat:
а кое-кто специализды по троллингу :negozhe:
Эти кое-кто специалисты, а не спицыализды.
А ну да, виноват! Настоящие профи!