程序员求职经验分享与学习资料整理平台

网站首页 > 文章精选 正文

数据规范化方法

balukai 2025-01-06 11:10:36 文章精选 8 ℃

人们不管在工作中或是生活中,往往会遇到很多很多指标,并需要将这些指标进行对比。但指标是复杂多样的,有定性的,定量的,半定量的。定量的指标具有清晰,明确,可对比等优点,往往是我们开展各项工作的重要依据。

定量指标虽然都是量化的,但也有很多类型,通常会有四种类型,一类是数值越大越好(称为极大型指标或效益型指标),比如成绩、利润等。一类是数值越小越好(称为极小型指标或成本型指标),比如污染度、犯罪率等。一类是数据越居中越好(称为居中型指标),比如某螺丝钉的直径,水的pH值等。另一类是数据是在一个区间范围内最好(称为区间型指标),比如人体的温度。

由于数据类型不同,所以在进行指标定量比较时,必须将它们都转化成可以同度量的同一类型的指标。这就称为数据的规范化处理。

数据的规范化处理包括一致化处理(正向化),无量纲化处理,同度量化处理。

一致化处理(正向化):所谓一致化处理就是将评价指标的类型进行统一。例如将极小型、居中型、区间型指标转换为极大型指标,使得任一属性下性能越优的方案变换后的属性值越大。

无量纲化处理:即将不同单位的指标进行无单位化处理,以便进行比较。

同度量化处理:将数据按比例进行缩放,使之落入一个特定的区域。通常将数据规范化到 [0,1] 或 [-1,1] 区间内。

数据规范化的常用方法有:

1.线性变换法

将原始决策向量x=(x1,x2,…xn)进行线性比例变换。其中xi代表不同方案的指标值。

①若x为极大型(效益型)属性:

其中xi*为规范化后的数据。

②若x为极小型(成本型)属性:

注:经过线性比例变换后:

(1)0≤xi*≤1。

(2)变换后指标为正向指标。

(3)经过变换后最优值不一定为1,最差值不一定为0。

2.极差变换法。

经过极差变换法可以使变换后的最优值为1,最差值为0。

①若x为极大型(效益型)属性:

②若x为极小型(成本型)属性:

注:经过极差变换后:

(1)0≤xi*≤1。

(2)变换后指标为正向指标。

(3)经过变换后最优值为1,最差值为0。

3.区间型属性的变换

若x为区间型属性。假设给定最优属性区间为[c,d],aj0为无法容忍下限,aj*为无法容忍上限。那么

注:经过该变换之后:

(1)0≤xi*≤1。

(2)变换后指标为正向指标。

(3)经过变换后最优值为1,最差值为0。

4.中间型属性的变换

若x为中间型属性。假设最优值为k,那么:

例:假设有四条生产线生产某零件,零件的标准直径为12mm,现从四条生产线分别抽取同样数量的零件,计算得平均直径如下表:

生产线

1

2

3

4

零件(mm)

12

11

13

15

变换后数据

1

2/3

2/3

0

5.向量归一化法

在一些如权重分配问题上,还需要将权重指标归一化处理,即各指标相加的和等于1。如对正项序列x=(x1,x2,…xn)进行变换:

注:经过该变换之后:

(1)0≤xi*≤1。

(2)显然

以上是数据规范化的一些常用方法。数据规范化方法还有很多,不同的情况可能需要不同的规范化方法。希望本文对你有所帮助。

最近发表
标签列表