当前位置:首页>维修大全>综合>

数据标准化三种方法(数据标准化的五种方法)

数据标准化三种方法(数据标准化的五种方法)

更新时间:2024-05-10 21:01:45

数据标准化三种方法

目前数据标准化方法有多种,归结起来可以分为直线型方法(如极值法、标准差法)、折线型方法(如三折线法)、曲线型方法(如半正态性分布)。不同的标准化方法,对系统的评价结果会产生不同的影响,然而不幸的是,在数据标准化方法的选择上,还没有通用的法则可以遵循。

常见的方法有:min-max标准化(Min-max normalization),log函数转换,atan函数转换,z-score标准化(zero-mena normalization,此方法最为常用),模糊量化法。本文只介绍min-max法(规范化方法),z-score法(正规化方法),比例法(名字叫啥不太清楚,归一化方法)。

方法1:min-max法(规范化方法)

min-max法也叫离差标准化,是对原始数据的线性变换,使结果映射到[0,1]区间。

方法2:z-score法(正规化方法)

这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。将A的原始值x使用z-score标准化到y。

z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。

SPSS默认的标准化方法就是z-score标准化。

z-score的简单化模型:y=1/(1+x) ,x越大证明y越小,这样就可以把很大的数规范在[0-1]之间了。

在Excel中进行z-score标准化的步骤如下:

1.求出各变量(指标)的算术平均值(数学期望)xi和标准差si ;

2.进行标准化处理:zij=(xij-xi)/si

其中:zij为标准化后的变量值;xij为实际变量值。

3.将逆指标前的正负号对调。

标准化后的变量值围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。

方法3:比例法(归一化方法)

注意该方法是针对全部数据为正值的序列。

更多栏目