数据规范化是将原来的度量值转换为无量纲的值。通过将属性数据按比例缩放,通过一个函数将给定属性的整个值域映射到一个新的值域中,即每个旧的值都被一个新的值替代,有3种规范化策略。 规范化
一、最小-最大(min-max)规范化
最小-最大规范化保持原有数据之间的联系。如果今后的输入落在A的原始数据值域之外,该方法将面临“越界错误”。
二、z-score规范化
当属性f的实际最大和最小值未知,或异常点左右了最小-最大规范化时,该方法是有用的。
三、小数定标规范化
小数定标规范化通过移动属性A的小数点位置进行规范化。