在离群点检测领域,传统LOF算法高维离散数据检测中精度较低,且参数敏感性较高。为了解决这一问题,提出了NSD算法(Neighborhood System Density Difference)。该算法基于密度差异度量的邻域系统方法,具有较高的检测精度和低参数敏感性。NSD算法的核心步骤如下:

  1. 截取距离邻域计算:首先计算数据集中对象在截取距离内的邻居点个数。

  2. 邻域系统密度计算:其次,计算对象的邻域系统密度,从而确定对象与邻域数据间的密度差异。

  3. 密度差异比较:通过比较对象密度和邻居密度,评估对象与邻域数据趋向于同一簇的程度,判断离群点的可能性。

  4. 输出离群点:最终识别出最可能是离群点的对象。

通过实验对比,NSD算法在真实数据集和合成数据集上表现出优越的性能,具有更高的检测准确率更高的执行效率以及更低的参数敏感性,相比LOF、LDOF和CBOF算法,展示了良好的应用前景。