Данныя нормализуютъ, отнимая изъ образца среднее ариѳметическое и дѣля это дѣло на среднеквадратическое отклоненіе.
А каковъ въ этомъ общій смыслъ?
Въ числителѣ мы получаемъ разницу между даннымъ образцомъ и среднимъ по выборкѣ. Но для чего намъ дѣлить на мѣру разброса въ выборкѣ? каковъ смыслъ этого частнаго? спасибо
Стандартизированная оценка показывает насколько далеко значение от среднего. Удобство такой оценки в том, что все переменные приводятся к одной мере — стандартному отклонению.
Если переменная распределена нормально, то по такому показателю легко понять квантиль: например, вероятность, что стандартизированная оценка будет больше 3 или меньше -3 равна 0.3%. Также нормализация нужна для применения некоторых статистических методов, опять же, потому что переменные разных размерностей приводятся к одной мере.
Просто так, конечно, нормализовывать каждую переменную смысла довольно мало. Если ваша статистическая модель имеет структуру, в которой важны размерности (тривиальный пример: у вас есть координаты каких-то точек на карте, и вы хотите найти кластеры из точек), то нормализуя данные вы теряете информацию, и получаете малоинтепретируемые бесполезные данные.