最新实例
复杂网络聚类算法特点与应用
复杂网络的聚类算法,挺适合那种时空维度交错又数据量巨大的情况。像遥感图像、交通流、甚至是实时导航系统,都是典型应用。你要是做空间的,肯定对什么拓扑结构、距离约束不陌生。这里面用到的方式也蛮丰富的,空间推理、几何计算啥的都得会点儿。 拓扑结构的挺吃数据结构功底的,不过一旦你搞清楚数据背后的时空语义,模型拟合的效果会比较惊喜。推荐你看看下面这几个文章资源,有些用 Kohonen 聚类入侵检测,有些用海豚算法网络。嗯,听着有点野,但还真挺实用。 如果你对Oracle 空间数据库感兴趣,那个网络拓扑结构的也比较系统,搭配可视化效果也还不错。还有用MATLAB做复杂网络实现的文章,代码清晰,逻辑也不绕,
物联网信息服务系统海量数据应用综述
物联网的海量数据一直挺折腾人的,信息服务系统的设计就是为了这个问题的。像存储、预、数据挖掘这些事儿,通通一网打尽。你要搞设备监控、环境追踪啥的,用这套系统准没错。 安全这块也做得比较到位,系统的隐私保护、可信机制讲得蛮细,不是走过场的那种,真的是从实践中总结出来的经验。尤其是搞GridDB或者Oracle的朋友,可以重点看看,思路挺清晰的。 嗯,系统架构部分是重点,写得落地,结合了实际平台的搭建流程。你要是正好在做物联网平台开发,尤其是对海量数据支持要求比较高的那种,这篇算是个挺不错的参考了。后面还提到了一些值得关注的挑战,比如安全容灾、系统可靠性啥的。 另外,如果你对相关系统感兴趣,像节能子
SQL Server 2008DataMining Add-Ins for Microsoft Office 2007数据挖掘插件
SQL Server 的挖掘插件套装,真挺适合经常和 Excel、Visio 打交道的数据师。SQL Server 2008 DataMining Add-Ins for Microsoft Office 2007 的Excel 表工具,功能挺全的,像什么回归、聚类、关联规则这些,直接在 Excel 里点两下就能跑。不用写代码,响应也快,挺适合不想折腾太多的人。数据预、模型构建、验证啥的,它都能搞定。而且界面做得还行,交互性强,不熟悉建模的人也能慢慢上手。就比如你要筛掉异常值、转化字段啥的,直接点选就完事儿了。Excel 数据挖掘客户端是另一个亮点,连接SQL Server Analysis
梯度提升树短期用电负荷预测模型
短期负荷预测的梯度提升树系统,响应快、精度高,适合想提高用电预测效率的开发者使用,支持 C/S 架构搭建。
分布分式并布行CIL式P并行逻C辑程序ILP设计研究逻辑程序设计研究
分布式 CILP 算法的并行效率还真不错,用的是主从式的静态负载平衡,搭配 C3 模型和元学习技术,蛮有意思的设计思路。如果你对关系数据挖掘感兴趣,这篇文章可以给你不少启发。是在多节点执行任务时,怎么让资源用得更顺、响应更快,这里讲得还挺细的。 CILP的并行版本在 COW 机群上跑得还蛮稳,效率提升。用到了元学习技术来适配模型,负载分配靠静态策略做的,还挺聪明的,省了不少资源调度的麻烦。实验数据也给了,速度快,平衡性也不错。 哦对了,搞分布式逻辑程序设计的可以看看,尤其是在做大规模关系推理的场景下,比如自动推荐系统、知识图谱挖掘那类项目,这种方式挺实用。用上并行 CILP,跑大数据集也没那么
图像挖掘与Web结构识别-SPSS Clementine应用宝典
图像挖掘的思路,蛮适合搞可视化和图像的前端玩一玩。它不只是识别图像,而是从图像结构里挖模式,比如布局、层级这些空间特征,挺像做页面结构优化时考虑 DOM 的嵌套关系和层次感。搭配下面这些资料资源还挺丰富,有的直接给了MATLAB代码,有的也比较直白,比如那个“图像与模式识别代码优化”,你点进去看看,结构清晰,响应也快,代码也简单。推荐那个叫“MATLAB 实现模式识别的源代码”的资源,里面的例子挺实用,跑一遍你就能懂它的基本逻辑。虽然是后端算法类的内容,但你想深入理解canvas、SVG图形结构的时候,用上这套思路,会比较有。哦对,别忘了看一下“聚类工具-MATLAB 模式识别应用”,聚类其实
C4.5算法在2型糖尿病分类规则提取中的应用
C4.5 算法的决策树模型在糖尿病数据里还挺有看头的。2 型糖尿病的数据量一大,用传统方法就挺吃力的。引入C4.5后,可以自动挖出一些蛮有意义的分类规则,准确率高达 97%,这在实际测试里表现也稳定。 用的是实测数据,不是什么假设模型,所以推出来的规律基本能对得上医生的判断。说白了,就是让机器先跑一圈,看能不能挖出哪些人容易得糖尿病。规则提取这块比较关键,适合做预警模型和干预建议。 要是你想跑跑试试,Matlab版本的 C4.5 源码还蛮全,matlab 环境下的决策树 C4.5 算法源码资源可以直接上手。另外也有基于WEKA的数据挖掘案例,界面化操作挺友好的。 想练手?可以下载Diabete
DW+OLAP+DM超市销售决策支持方案
基于 DW、OLAP 和 DM 组合拳的超市销售决策系统,实用性真的挺高的。数据从业务系统里一抽,经过清洗、整合,再丢进数据仓库,前面几步就是在打好地基。再用OLAP搞多维,什么时间、地区、商品分类,轻松切换,响应也快。加一层数据挖掘,比如找出哪些商品常一起卖,或者根据客户习惯来搞定精准促销,这种玩法真的是提升销售的利器。 系统用的是Microsoft Analysis Services,前端那块是VB 6.0写的,虽然老,但当年挺稳的。多维查询靠MDX搞定,管理层接口也封装得不错,用DSO直接操控服务。整套东西搭起来不复杂,但思路挺清晰,适合做中小型零售系统的决策参考。 多维设计上用了星型模
其参数说明如下-数据挖掘原理与SPSS-Clementine应用宝典
其参数说明如下: If:指定一个CLEM条件表达式,在执行时为每个字段进行评估。如果条件为真(或者在数值的条件下非假),则新字段赋的值在下面的Then表达式中。 Then:在前面定义的If语句为真(或者非假)时,给新字段赋一个值或者CLEM表达式。 Else:在前面定义的If语句为假时,给新字段赋一个值或CLEM表达式。
数据仓库关联规则挖掘使用SQL Server进行数据挖掘
使用SQL Server进行数据挖掘,关联规则挖掘适合对数据库或数据仓库中的数据进行深度。你可以通过数据挖掘向导创建数据挖掘模型,轻松掌握挖掘结构和模型的基本概念。操作起来也不复杂,了解如何使用数据挖掘设计器和模型查看器就能上手。数据挖掘报告也能快速生成,精确度高,完全符合实际需求。你可以通过挖掘准确性图表提升模型的效果,最大化发现潜在数据规律。这样的方法适合做多维度的复杂数据,挖掘深度大、准确性强。如果你想进一步深入,可以参考这些相关文章:比如《数据仓库与数据挖掘关联规则挖掘》、关联规则挖掘数据挖掘中的关联规则等,都会你在实际开发中更加得心应手。