近年来,数据挖掘领域取得了显著进展,主要得益于数据分析技术的快速发展。二元分类技术作为数据挖掘的重要分支,能够根据特定标准将数据分为两类。针对这一领域的不同需求,已经涌现出多种统计和机器学习算法。选取了一组分子作为案例,展示了一种基于新测量功能的二元分类方法,该方法通过可靠性计算与传统算法有所不同,提升了分类准确度。研究表明,该方法在分子数据集上的f度量超过了70%。
一种新型基于相似度的二元监督分类算法研究以檀香气味为例
相关推荐
Moth Swarm Algorithm (MSA)一种新型元启发算法
Moth Swarm Algorithm (MSA):灵感来源于飞蛾对月光的导向。该算法引入了两种创新优化算子:(1)基于种群多样性的交叉点动态选择策略,利用差异向量Lévy-mutation提升侦察阶段的探索能力;(2)集成即时记忆的联想学习机制,模拟飞蛾的短期记忆,解决经典粒子群算法的初始速度问题。此代码演示了MSA在23个常用基准测试中的应用。详细信息参见Mohamed等人(2017)的研究:“使用蛾群算法的最优潮流”。
Matlab
1
2024-08-01
社交网络主题检测与分类:以 Twitter 为例
本书提出了一种新颖的社交网络主题检测和分类方法。它解决了当前研究界关注的若干研究和技术挑战,包括对社区成员之间关系和交流的分析,内容质量、权威性、相关性和及时性,基于媒体消费的流量预测,垃圾信息检测,以及个人信息的安全、隐私和保护。
算法与数据结构
5
2024-04-30
探索图论算法: 一种基于 Matlab 的方法
探索图论算法: 一种基于 Matlab 的方法
本资源深入研究图论算法领域,并提供基于 Matlab 的实践方法。内容涵盖经典算法(如最短路径、最小生成树)以及网络流和匹配等高级主题。通过实际示例和 Matlab 代码实现,帮助读者掌握将理论应用于实际问题。
Matlab
9
2024-05-23
一种新型全局孤立点识别方法-基于层次聚类的创新研究.pdf
针对现有的孤立点检测算法在通用性、有效性、用户友好性及处理高维大数据集的性能还不完善,提出了一种快速有效的基于层次聚类的全局孤立点检测方法。该方法利用层次聚类结果,通过聚类树和距离矩阵可视化评估数据的孤立度,并确定孤立点数量。从聚类树顶层开始,无监督地去除孤立点。仿真实验验证了本方法能快速有效地识别全局孤立点,具备良好的用户友好性,适用于不同形状的数据集,特别适用于大型高维数据集的孤立点检测。
数据挖掘
5
2024-07-16
Jaya一种创新的优化算法
介绍了一种简单但强大的优化算法,适用于解决有约束和无约束的优化问题。所有基于进化和群体智能的算法都是概率算法,需要共同的控制参数,如种群规模、世代数、精英规模等。不同的算法除了共同的控制参数外,还需要特定的算法参数。例如,GA使用变异概率、交叉概率和选择算子;PSO使用惯性权重、社会和认知参数;ABC使用围观蜂数、雇佣蜂数、侦察蜂数和限制数;HS算法使用和声记忆考虑率、音调调整率和即兴次数。其他算法如ES、EP、DE、SFL、ACO、FF、CSO、AIA、GSA、BBO、FPA、ALO、IWO等也需要对各自的特定参数进行优化。算法特定参数的适当调整对算法性能非常关键,而不当的调整可能导致计算量增加或局部最优解。为解决这一问题,Rao等人(2011)引入了基于教学的优化(TLBO)算法,该算法无需特定于算法的参数,只需要通用的控制参数,如种群大小。
Matlab
0
2024-09-25
研究论文-一种自然聚类发现的新算法.pdf
当前的聚类方法如K-means和DBSCAN采用全局参数,难以准确发现数据的自然聚类结构。新提出的分级聚类算法CluFNC通过调整网格大小、噪声阈值和神经节点数量,能够在数据空间中精确识别内部聚类特征。该算法首先根据参数划分数据空间网格,然后利用高斯影响函数计算每个单元的场强,接着运用SOM算法对网格位置和场强进行聚类,最后通过Chameleon算法对SOM聚类得到的神经网络节点权值进行最终的数据空间聚类映射。理论和实验结果表明,该算法能有效发现数据中的自然聚类特性。
数据挖掘
2
2024-07-31
一种强大的角匹配技术基于轮廓的ARCSS检测器的新型应用
尽管该匹配算法最初匹配弧形角[1-2],但它同样适用于各种基于轮廓的角,如[3-4]。详细的算法描述可参见文献[2,5,6]。[1]提出了仿射弹性曲率尺度空间角点检测器,见IEEE ICASSP 2007。[2]改进的曲率尺度空间角点检测器及其在转换图像识别中的稳健角点匹配方法,详见IEEE TIP 2008。[3]提出了基于弦到点距离累积技术的鲁棒图像角点检测方法,见IEEE TMM 2008。[4]介绍了基于弦到点距离累加技术的快速角检测器,见IEEE DICTA 2009。[5]探讨了高效转换图像识别技术,详见Elsevier JVCIR 2009。[6]介绍了一种强大的角匹配技术,见IEEE ICME 2007。
Matlab
2
2024-07-23
基于遥感与GIS的绿洲土地利用格局研究——以张掖绿洲为例
研究方法
本研究以2000年Landsat 5 TM影像为数据源,采用人工目视解译方法,结合GIS空间分析技术,对张掖绿洲土地利用格局进行分析。
影响因子分析
运用典型相关分析方法,探究自然因素和人文因素对张掖绿洲土地利用格局的影响程度,并通过典型相关系数和冗余度分析检验结果的可靠性。
统计分析
4
2024-04-29
Ant Lion Optimizer (ALO)一种新兴的全局优化元启发算法-Matlab开发
Ant Lion Optimizer (ALO)模仿了自然界中蚁狮的狩猎机制,包括随机行走的蚂蚁、陷阱构建、困蚂蚁于陷阱、捕捉猎物和重建陷阱等五个关键步骤。该算法的论文来源为Seyedali Mirjalili的工程软件进展第83卷(2015年5月),页码为80-98,ISSN为0965-9978,详情请访问http://dx.doi.org/10.1016/j.advengsoft.2015.010。更多信息请见:http://www.alimirjalili.com/ALO.html。
Matlab
2
2024-07-22