Къ примѣру у насъ есть таблица, гдѣ въ нѣкоторыхъ столбцахъ перечислены признаки, и каждый образецъ м.б. обладать однимъ изъ нихъ, къ примѣру въ нашей таблицѣ есть большая жёлтая утка, маленькая бѣлая кошка и т.д., т.е. всего три признака, каждый признакъ изъ нѣкоторого числа.
Для начала хотѣлось бы знать общее число составныхъ (изъ 3 признаковъ) группъ (модное жаргонное словцо: когортъ). Корректно ли складывать размѣщенія съ повтореніями? Мы легко можемъ узнать число уникальныхъ значеній, какъ и число уникальныхъ значеній каждаго изъ 3 признаковъ. Тогда, число уникальныхъ группъ равно ли
числу образцовъ*число уникальныхъ перваго признака + ..*второго признака и т.д.?
Врядъ-ли, вѣдь множества самихъ признаковъ не пересѣкаются, нужна другая формула. Мы могли бы её подсказать. Спасибо.
Вы хотите узнать, сколькими способами можно разложить N объектов по M корзинам? Или что?
Цитата: Andrey Lukyanov от января 4, 2021, 13:43
Вы хотите узнать, сколькими способами можно разложить N объектов по M корзинам? Или что?
Хочет написать ещё одно сообщение в старой орфографии. ;D
Андрѣй, сколькими , нѣтъ. я вообщѣ сомнѣваюсь, что та формула изъ комбинаторики умѣстна. Мы ничего не размѣщаемъ
представьте таблицу
животное 1 собака полосатая большая
животное2 кошка бѣлая средняя
животное3 утка рыжая малая
животное4 кошка чёрная огромная
такимъ образомъ, три набора признаковъ. сколько всего группъ (каждая группа имѣетъ по одному признаку). Сколько группъ въ зависимости отъ числа признаковъ?
Что Вы называете группой? Пример какой-нибудь приведите.
Группа - здѣсь "Сочетанie признаковъ".
т.е. каждое животное въ таблицѣ имѣетъ 3 признака, каждый признакъ выбирается изъ опредѣлённаго множества.
4³
даже зрительно видно, что меньше, просто 4 уникальныя группы.
думаю, размещения, с повторениями и без, тут не идут : там у нас есть множество, к. распоеделяется по другому множеству. множества туристов и номеров, множества шаров в урне и вынутых. а тут у нас некоторое число признаков. каждый признак имеет несколько значений. а образец может иметь по одному признаку. у нас множеств (1 + число признаков). поправьте меня, если я не прав. но видно, что уникальных групп 4, никак не 4**3
Цитата: Versteher от января 4, 2021, 21:15даже зрительно видно, что меньше, просто 4 уникальныя группы.
Я так и не понял, как Вы формулируете и формируете "группу".
Если каждое животное обладает любым признаком из предпоследнего столбца и любым признаком из последнего столбца, значит, для каждого из 4 животных есть 4² вариантов пар признаков.
Цитата: Versteher от января 4, 2021, 21:15а образец может иметь по одному признаку.
Тогда надо ещё прибавить животных с одним признаком, каковых 4*8.
И 4 животных без признаков вообще (вернее, с единственным признаком "биологический вид").
это ещё старина Кант придумал метод: берёшь предмет, и придаёшь ему признаки. говорил я ему за завтраком, что это надо формулу записать..
группа - набор признаков. в таблице столбцов с признаками 3. опять же, уникпльных сочетаний в таблице 4, но должна быть связь между числом признаков, значениями признаков и числом образцов.
удивительно, но и на вече программистов, на этот вопрос ответа тоже пока не нашли
зачѣмъ убавлять признаки? обычно у данных полный набор признаков.
ещё, такой же пример.
список покупателей, много стран, два пола, несколько магазинов.
у покупателя точно есть пол, страна и магазин, где его отоварили.
китайка купила (конечно, шаверму) на Ленсовѣта улице
американец купил на Звѣздной улице.
вопрос : сколько всего таких покупателей - обладателей всѣхъ признаков?
Цитата: Versteher от января 4, 2021, 21:26
удивительно, но и на вече программистов, на этот вопрос ответа тоже пока не нашли
Ничего удивительного. Ведь тут основная сложность не в том, чтобы решить проблему, а в том, чтобы понять, что вам вообще требуется. Тут ни упоминание когорт (термин из лонгитюдного анализа данных, в других контекстах обычно не используется), ни Канта не помогают.
Цитата: Versteher от января 4, 2021, 21:26группа - набор признаков.
Группой обычно называется множество уже готовых объектов, а не их признаков.
Цитата: Versteher от января 4, 2021, 21:26в таблице столбцов с признаками 3. опять же, уникпльных сочетаний в таблице 4
Так покажите эти 4, их же всего 4. Чтобы мы понимали, от чего отталкиваться!
И если добавить ещё один столбец: пол, то сколько окажется "уникальных сочетаний"?‥
Цитата: Versteher от января 4, 2021, 21:30список покупателей, много стран, два пола, несколько магазинов.
у покупателя точно есть пол, страна и магазин, где его отоварили.
китайка купила (конечно, шаверму) на Ленсовѣта улице
американец купил на Звѣздной улице.
вопрос : сколько всего таких покупателей - обладателей всѣхъ признаков?
Если как Вы считать, то количество покупателей задано изначально в столбце покупателей. Логично, да?
я боюсь, что фотограф Воллигер снова скажет, что я повторяюсь, я не хочу расстраивать ф. В.
соглашусь, что хорошо найти славянское обозначение для когоорты. и так, это сочетание признаков, где каждый признак имеет набор значений.
и так, есть m значений одного признака, n значений другого признака, l число образцов, принимающих сочетания этих признаков. можно ли установить связь между этими вводными и числом образцов?
что значит, лонгитюдный?
я совершенно не приветствую варварское эсперантие, на котором изъясняются в ИТ / финтехе и смежных отраслях. поэтому я старался говорить 'группа', а лучше и вовсе найти определение из родной речи
Цитата: Versteher от января 4, 2021, 21:49есть m значений одного признака, n значений другого признака, l число образцов, принимающих сочетания этих признаков. можно ли установить связь между этими вводными и числом образцов?
Если m < l или n < l, неизбежно будут объекты с совпадающими признаками (признак: пол [м, ж], l > 2 → у не менее чем 2 объектов пол будет совпадать).
Если не может быть объектов, у которых совпадают одновременно m и n, то решение зависит от значения l — если оно достаточно велико, условие окажется невыполнимым (несовпадающих сочетаний не хватит на всех).
Bhudh, вот эти четыре :
собака полосатая большая
кошка бѣлая средняя
утка рыжая малая
кошка чёрная огромная
но в большом массиве может встретиться другая большая полосатая собака. можно назвать признаки: вид, цвет, размер. представлены три значения вида и по четыре размера и цвета соответственно.
есть ли зависимость между числом признаков и числом образцов, имеющим эти признаки?
Цитата: Versteher от января 4, 2021, 21:51я совершенно не приветствую варварское эсперантие, на котором изъясняются в ИТ / финтехе и смежных отраслях. поэтому я старался говорить 'группа'
Группа — это термин не из IT или финтеха, а из, внезапно, теории групп (https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BE%D1%80%D0%B8%D1%8F_%D0%B3%D1%80%D1%83%D0%BF%D0%BF). Это чистая математика.
дыкъ я и избегал Когорту, а не Группу
Цитата: Versteher от января 4, 2021, 21:56представлены три значения вида и по четыре размера и цвета соответственно.
есть ли зависимость между числом признаков и числом образцов, имеющим эти признаки?
Тут ответ может быть один: зависимость будет, если Вы намеренно её каким-то образом установите. Например, поставив искуственные ограничения по сочетаемости.
Но каким образом число сочетаний может определять число объектов, если Вы сами пишете:
Цитата: Versteher от января 4, 2021, 21:56в большом массиве может встретиться другая большая полосатая собака
Откуда-то ведь берётся
большой массив, и, видимо, размер массива никак не зависит от признаков: где другая большая полосатая собака, там и третья большая полосатая собака, и четвёртая... Как в таком случае признаки могут определить размер массива?
а может, ея и нѣтъ вовсе. как число значений каждого признака влияет на число образцов?
но ЭВМ же может пробежать по массиву и посчитать, сколько уникальных групп.
думаю, может.
но похоже, действительно, зависимости между признаками и образцами нѣтъ. давайте просто поделим их с остатком, и так до нуля, и выпьем.
или тема не закрыта?
Цитата: Versteher от января 4, 2021, 22:02как число значений каждого признака влияет на число образцов?
Никак. Если число образцов (
l) у Вас заранее задано, то оно задано
Вами.
Цитата: Versteher от января 4, 2021, 22:05но ЭВМ же может пробежать по массиву и посчитать, сколько уникальных групп.
Вам надо знать, сколько уникальных комбинаций признаков может принимать объект или знать, сколько в массиве всего может быть объектов?
но оно же есть. тут уже мы просто описуем, ничего не изобретаем сами. тысячи тысяч животных, сколько из них уникальных групп. массив задан. ЭВМ посчитает, какие значения есть, потом их сочетания. чисто описательно
сколько в массиве, это легко, мы сделаем набор, и получим уникальныя значения.
сколько может принимать сочетаний уникальных значений, я всё больше склоняюсь, что установить невозможно
Я в начале не обратил внимания, что в первом столбце две кошки (а нефиг табличные тэги игнорировать и пробелами отбивать!), поэтому дал неверный ответ.
Верный, конечно, такой: {собака, кошка, утка}×{полосатая, бѣлая, рыжая, чёрная }×{большая, средняя, малая, огромная} → 3×4×4 = 48.
Цитата: Versteher от января 4, 2021, 22:05но ЭВМ же может пробежать по массиву и посчитать, сколько уникальных групп.
Зачэм считать, вах? Все можно напысат!
большая полосатая собака
большая полосатая кошка
большая полосатая утка
большая бѣлая собака
большая бѣлая кошка
большая бѣлая утка
большая рыжая собака
большая рыжая кошка
большая рыжая утка
большая чёрная собака
большая чёрная кошка
большая чёрная утка
средняя полосатая собака
средняя полосатая кошка
средняя полосатая утка
средняя бѣлая собака
средняя бѣлая кошка
средняя бѣлая утка
средняя рыжая собака
средняя рыжая кошка
средняя рыжая утка
средняя чёрная собака
средняя чёрная кошка
средняя чёрная утка
малая полосатая собака
малая полосатая кошка
малая полосатая утка
малая бѣлая собака
малая бѣлая кошка
малая бѣлая утка
малая рыжая собака
малая рыжая кошка
малая рыжая утка
малая чёрная собака
малая чёрная кошка
малая чёрная утка
огромная полосатая собака
огромная полосатая кошка
огромная полосатая утка
огромная бѣлая собака
огромная бѣлая кошка
огромная бѣлая утка
огромная рыжая собака
огромная рыжая кошка
огромная рыжая утка
огромная чёрная собака
огромная чёрная кошка
огромная чёрная утка
Цитата: Versteher от января 4, 2021, 21:51
что значит, лонгитюдный?
Длительный по времени.
Цитата: Versteher от января 4, 2021, 21:58
дыкъ я и избегал Когорту
И правильно делали. Когорта обозначает группу, связанную каким-то временным признаком: датой рождения или месяцем заболевания ковидом, например.
я честно нажимал таб, но ничего не происходило.
всего признаков = произведение всѣхъ значений каждого признака. холосо.
мы никак не можем приблизиться к ответу?
Цитата: Versteher от января 4, 2021, 22:30я честно нажимал таб, но ничего не происходило.
Мы на форуме. Здесь вся разметка делается тэгами. Табличная — табличными тэгами.
[table],
[tr] и
[td].
Цитата: Versteher от января 4, 2021, 22:30всего признаков = произведение всѣхъ значений каждого признака.
Не признаков.
Сочетаний признаков.
Цитата: Versteher от января 4, 2021, 22:30мы никак не можем приблизиться к ответу?
Какой ещё ответ Вам нужен, кроме количества уникальных сочетаний?
где у Вас в формуле сочетание?
там только количества значений каждого признака.
я всё хочу узнать, можно ли число именно сочетаний у объектов посчитать, хотя кубыть counterinitiative это..
Цитата: Versteher от января 4, 2021, 22:37где у Вас в формуле сочетание?
В результате получается. Не верите: сравните результат с числом вариантов в спойлере. Или Вы его не открывали?
о, мусеййер аль абсам,
о, мусейтер аль аркам!
действительно, отлично. ну а говно вопрос, это число, да и разместить с повторениями по числу объектов?
Цитата: Versteher от января 4, 2021, 22:43это число, да и разместить с повторениями по числу объектов?
Что-то не понял. А что, в полном списке объекты не повторяются? Вроде кошек с собаками да утками аж по 16 штук.
Или Вам надо, чтобы была ещё одна большая полосатая собака? Так добавьте кого надо по сколько надо.
повторяются. но ведь это уже прямая комбинаторика, нѣтъ?
48 сочетаний признаков у 4 объектов, кольцо раз м. б.? 48**4, нѣтъ?
Цитата: Versteher от января 4, 2021, 23:0348 сочетаний признаков у 4 объектов
Откуда Вы взяли "4 объектов"? 48 сочетаний это и есть 48 объектов, каждый со своим уникальным сочетанием.
А если Вам нужно узнать, сколько разных сочетаний по 4 из уже этого множества может получиться, то да, 48⁴.
а всё-таки, в науке о данных д.б. методы узнать: чт сложного пробежать массив несколько раз и узнать уникальныя группы, встречающиеся только в этом массиве
Я, по-Вашему, как 48 элементов множества написал? Ручками все слова копипастил?
Щаз. Написал скрипт в одну строчку и запустил, он мне выдал полный список, который я и скопировал.
Причём не выходя из браузера, в консоли JavaScript.
https://www.youtube.com/watch?v=IiThV188p_E (//http://)
Что тут происходит? Вече программистов ;D
Вам, похоже, классы эквивалентности нужны.
Можно каждый признак считать отношением эквивалентности, разбивать всё множество животных относительно этого отношения на непересекающиеся классы эквивалентности.
По типу животных получается 3 класса. В одном классе все утки, в другом - собаки, в третьем кошки. Любая кошка - представитель своего класса.
По масти получается 4 класса, по размеру тоже 4 класса.
Итого 3 способа разбить массив на классы эквивалентности по одному признаку. Для первого способа получаем 3 класса эквивалентности, для второго и третьего - по 4 класса.
Теперь будем комбинировать 2 признака. Животное + размер, животное + масть, размер + масть.
Например, животное + размер. Утки образуют 4 класса по размеру, кошки ещё 4 класса, собаки ещё 4 класса. Итого по отношению животное + размер массив разбивается на 12 классов эквивалентности. Любая большая утка является представителем своего класса.
Аналогично отношение животное+масть даёт разбиение на 12 классов эквивалентности.
Отношение размер + масть даёт разбиение на 16 классов эквивалентности.
Итого 3 способа разбить массив на классы эквивалентности по двум призака. Для первого и второго способа получаем 12 классов, для третьего - 16.
Теперь будем комбинировать все 3 признака, получим 3*4*4 = 48 классов эквивалентности. Которые перечислил Бхудх. Любая большая полосатая утка является представителем класса больших полосатых уток.
Итого 1 способ разбить массив на классы эквивалентности. Классов - 48 штук.
Всего 3+3+1 = 7 различных способов разбить массив на классы эквивалентности. Для каждого способа будет своё количество классов в разбиении.