Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Определение пола автора текста

Автор A.kornilov1, июня 29, 2014, 14:54

0 Пользователи и 1 гость просматривают эту тему.

ginkgo

Цитата: A.kornilov1 от июля  2, 2014, 19:48
По всей видимости окружающего мира
Всего полностью? А можно про разницу этого восприятия в общих чертах?
"Θα φτιάξουμε μαρμελάδες."

A.kornilov1

ginkgo
Легко:
К примеру
Есть мужчина и женщина
Особенности их восприятия формируют отношение к слонам
Мужчины чаще говорят, что слоны "большие", а женщины, что они "огромные".
И так на протяжении многих тем и понятий.

Сделав выборку и посмотрев на неё мы делаем выводы и далее о всех, кто говорит, что слоны - "огромные", мы говорим что у них - женское восприятие.

ginkgo

A.kornilov1, на абстрактном и не соответствующем действительности примере со слонами разница не видна. Мне бы пример из реальности.
"Θα φτιάξουμε μαρμελάδες."

Mortifer

Mindig van remény - Всегда есть ремень (с)

Нет большего зла, чем упрощенчество. Из него - всё остальное зло.

A.kornilov1

ginkgo

Если буду рассказывать про реальность - раскрою в чем есть суть алгоритма. Чего не хотелось бы делать.
Поэтому процитирую одну из своих личных записей, которая помогает мне самому понять как это всё работает

От состояния психики человека зависит его восприятие
От восприятия зависит деятельность человека
Речь - один из продуктов деятельности  человека
Т.е. "измерив" речь человека и сравнив с другими измерениями  мы можем некоторым образом создать категории на основе первоначальной выборки.
В дальнейшем по принадлежности к некоторым из этих категорий исследуемого мы можем говорить о его психике, а точнее восприятии мира.

I. G.

A.kornilov1, определите пол страждущим! У Вас есть нерассмотренные заявки.
...И мимимишечных круглышек,
Что безусловно хороши,
Но очень вредны для души.

dragun97yu

Скопка - это маленькая скопа.

A.kornilov1


dragun97yu

Скопка - это маленькая скопа.

A.kornilov1

dragun97yu
Цитата: dragun97yu от июля  2, 2014, 20:57
А где будет использоваться алгоритм?
Вот - пытаюсь придумать.
Пришел на этот форум за идеями, задал вопросы, жду пока кто-нибудь кроме Ильича скажет что-нибудь дельное :)

ginkgo

Цитата: A.kornilov1 от июля  2, 2014, 20:42
От состояния психики человека зависит его восприятие
От восприятия зависит деятельность человека
Речь - один из продуктов деятельности  человека
То, что речь зависит от состояния психики, примерно понятно. Непонятно, что там с полом.

Цитата: A.kornilov1 от июля  2, 2014, 20:42
Если буду рассказывать про реальность - раскрою в чем есть суть алгоритма. Чего не хотелось бы делать.
Даже если один единственный пример приведете?
"Θα φτιάξουμε μαρμελάδες."

A.kornilov1

ginkgo
Так и пол ( а точнее отождествление себя с некоторым образом - мужским или женским ) - есть одно из отражений восприятия
Пол был взят просто одна из категорий - самая простая для проверки.

Примеры анализируемых текстов я скидывал. А вот как я это делаю - оставлю в тайне.

Mortifer - Я готов при всех себя объявить еретиком, дураком и почти кем угодно, если мне будут даны более-менее внятные ответы ;)

Лукас

«Победоносил, победоносю и победоносить буду». Георгий Победоносец
«Я мстю, и мстя моя будет ужасной» - объявил бобёр лесу.
«Бог чува Србе», али је рок трајања истиче!

A.kornilov1

Цитата: Лукас от июля  2, 2014, 21:16
По моему прицел сбит с этими женщинами средне.

Не могу не поприветствовать дельное замечание.
Происходит это из-за недостаточно большой первоначальной выборки (базы то-бишь )
с которой и сравниваются тексты тех или иных авторов.

Вроде исправил - а там посмотрим.

Лукас

A.kornilov1
Возможно нужно анализировать большой текст, чтобы действительно что-то выяснить. Если такое вы не делали.

Это как в психологических тестах - при 10-20 вопросах на самом деле ничего толком не выяснишь, а нужно хотя бы 80 вопросов (а в некоторых случаях и 100).
«Победоносил, победоносю и победоносить буду». Георгий Победоносец
«Я мстю, и мстя моя будет ужасной» - объявил бобёр лесу.
«Бог чува Србе», али је рок трајања истиче!

A.kornilov1

Лукас
Можно и так поступить. Но если адаптировать задачу к современным реалиям, то и 1000 слов сложно найти у одного человека. А кому ж понадобится алгоритм, который может работать только с громоздкими текстами?
Да и тем паче сейчас меня результаты более чем удовлетворяют, ведь я вижу как их улучшить.

А улучшить их достаточно просто - необходимо работать с базой всячески пополняя и категоризируя её. ( добавить к примеру возраст, а может и более интересные вещи )
+ У меня сейчас очень много "шума" так как я беря тексты никоим образом не очищаю их от "слов-маркеров" ( слов которые обозначают что-либо, которые нельзя заменить синонимами), хотя подобная очистка способна опять же увеличить эффективность ...
И еще много чего другого.


Да и не ставил я перед собой задачу создать самый точный алгоритм - главное, на мой взгляд, требования к его работе. Ведь те же самые психологи не используют для оценки интеллекта тесты Айзенка, а используют более практичные Матрицы Равена, которые пусть и не так точны, но зато намного удобнее и проще в обращении.

dragun97yu

Так вы говорите, что с увеличением числа слов уменьшается точность определения?
Что же так? :what:
Скопка - это маленькая скопа.

A.kornilov1

Цитата: dragun97yu от июля  2, 2014, 21:39
Так вы говорите, что с увеличением числа слов уменьшается точность определения?
Что же так?
Все, как всегда, просто : база была взята для 1000 слов в среднем. И если отклоняться от этого числа более чем в 1.5 раза, то результаты естественно будут "смазываться".

P.S. А где это я такое говорил ? :)

dragun97yu

Цитата: A.kornilov1 от июля  2, 2014, 21:42
Цитата: dragun97yu от июля  2, 2014, 21:39
Так вы говорите, что с увеличением числа слов уменьшается точность определения?
Что же так?
Все, как всегда, просто : база была взята для 1000 слов в среднем. И если отклоняться от этого числа более чем в 1.5 раза, то результаты естественно будут "смазываться".

P.S. А где это я такое говорил ? :)
Выше было, чуть ли не в самом начале... Нет?
Скопка - это маленькая скопа.

A.kornilov1

dragun97yu
Цитировать
1)Чем больше спец слов - тем хуже результат

Лукас

A.kornilov1
Значит для хорошего результата нужен бытовой текст?

Типа: Купил вчера чайник хороший, заварил чай, съел печенье...
«Победоносил, победоносю и победоносить буду». Георгий Победоносец
«Я мстю, и мстя моя будет ужасной» - объявил бобёр лесу.
«Бог чува Србе», али је рок трајања истиче!

A.kornilov1

Лукас
Грубо говоря да. Но это сейчас. И это проблема Техническая

Единственное не из технических препятствий что я приметил, это то, что тексты обращенные к другим людям обрабатывать гораздо легче ( подборки сообщений к примеру ) нежели чем обращенные к себе ( блоги о душевных страданиях автора ) или к предмету ( аналитика в новостях)

dragun97yu

А, собственно, что можно сказать?
Женщинам свойственна речь красивая, культурная и длинная, а мужчинам главное передать информацию :)
Скопка - это маленькая скопа.

Лукас

Цитата: dragun97yu от июля  2, 2014, 21:54
Женщинам свойственна речь красивая, культурная и длинная, а мужчинам главное передать информацию
Типа того?  ;)

Она: Бушевали морские волны окатывая берег солёной водой.
Он: Был шторм.
«Победоносил, победоносю и победоносить буду». Георгий Победоносец
«Я мстю, и мстя моя будет ужасной» - объявил бобёр лесу.
«Бог чува Србе», али је рок трајања истиче!

dragun97yu

Скопка - это маленькая скопа.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр