Outlier-DivideConquer

当前话题为您枚举了最新的Outlier-DivideConquer。在这里,您可以轻松访问广泛的教程、示例代码和实用工具,帮助您有效地学习和应用这些核心编程技术。查看页面下方的资源列表,快速下载您需要的资料。我们的资源覆盖从基础到高级的各种主题,无论您是初学者还是有经验的开发者,都能找到有价值的信息。

Outlier-DivideConquer 近似聚集查询中的离群分治取样算法(2011年)
取样是一种普遍有效的近似技术,利用取样技术处理近似聚集查询在决策支持系统和数据挖掘中广泛采用。正确有效地产生近似查询结果并最小化误差是处理近似查询的关键目标。提出了Outlier-DivideConquer算法,结合误差确界,只需单次扫描数据集,特别适用于高方差分布的聚集属性,克服了随机均匀取样的局限性,显著降低近似查询误差,且比同类算法执行效率更高。实验验证显示,该算法与传统均匀取样算法相比具有显著优势。
异常(Outlier)的定义及检测方法
异常(Outlier)指的是数据集中与大部分数据显著偏离的数据点,其偏离程度超出随机因素的范围,可能源于完全不同的生成机制。根据Hawkins的定义,异常是数据中那些使人怀疑其生成方式不同于其他数据的点。根据Weisberg的看法,异常是不符合数据集其他部分统计模型的数据。Samuels认为,异常是与数据集中其余部分显著不同的数据点。Porkess指出,异常是远离数据集中其他数据点的极端值。
xgboost代码回归matlab-kdd17-outlier-detectionkdd17-离群值检测
xgboost代码回归matlab在度量学习背景下进行上下文空间离群值检测。此代码由宾夕法尼亚州立大学的Guanguan Zheng编写,并应用于kdd 2017论文:“通过度量学习进行上下文空间离群值检测”,收录于第23届ACM SIGKDD国际会议论文集第2161-2170页。该代码的度量学习部分(位于MLKR1.0文件夹中)由Kilian Q.Weinberger编写,用于内核回归。我们对其进行了修改以增强输入输出功能,并计划更新以兼容Windows和Mac OS系统。建议在anaconda3环境下安装Python 3,并配备Matlab及相关Python包(如xgboost)。