最新实例
云计算的定义-刘鹏云计算与数据挖掘
云计算的定义云计算是一种商业计算模型。它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。 *
数据挖掘白皮书,数据挖掘的入门教材
介绍什么是数据挖掘,数据挖掘可以做什么.数据挖掘是一种高级数据分析技术,它从日常积累的、海量的信息库中提炼、抽取、发现隐藏的、间接的、有意义、有价值的、可以直观表达的规则、知识和信息,辅助管理人员制定正确的决策。数据挖掘不能告诉你为什么一件事情会发生,但能告诉你可能会发生什么事情,数据挖掘得出的结论往往最具有客观性、可用性、和隐藏性,是其他方法所望尘莫及的。数据挖掘是一种高级数据分析技术,其核心在于从海量的、日常积累的信息库中提炼、抽取并发现隐藏的、有价值的知识和信息。数据挖掘不侧重于解释事件发生的原因,而是预测可能出现的结果,提供客观、可用和隐蔽的洞察,这些洞察在其他分析方法中难以获取。与传
Data Mining Patterns数据挖掘模式合集
数据挖掘里的经典套路,data-mining-patterns 是个蛮实用的资料合集。整理了关联规则、频繁项集、多层模式这些常见模式的算法和实践文章,内容不深奥,上手挺快的。适合你快速回顾或补补基础。像是用 Apriori 算法挖频繁项集,文章里讲得清楚,还有代码和示例。你可以看看使用 Apriori 算法挖掘频繁项集与关联规则这篇,例子简单明了。想了解模式背后的思路?挖掘关联规则的重要性及频繁模式挺适合。作者讲了怎么判断哪些规则有价值,还有些业务场景的小案例。如果你对非频繁模式、加权规则这些冷门方向感兴趣,非频繁模式关联算法 和 加权负关联规则挖掘 也都收录了,偶尔遇到复杂数据集可以用上。多
EoyooCMS Mature 2.0ASP.NET内容管理系统
基于 B/S 架构的 EoyooCMS Mature 2.0,算是我用过比较顺的 ASP.NET 内容管理系统之一了。团队是从 2007 年就开始整活的老牌开发,系统基本功扎实,像数据库结构、底层逻辑、前端 UI 都是一手包办,没外包那一套,稳定性、扩展性都不错。 多模型的设计灵活,文章、图册、视频、下载、人才这些常见类型都支持,而且字段还能自定义扩展,基本能应付绝大多数建站需求。你要建企业站、资源站、甚至商城的雏形,也都能搞得定。 后台体验算是让我印象最深的,界面不花哨但顺手,程序员、设计师、运营各自用起来都不卡手。搭配上C#+AJAX加持的极速访问,响应也快,页面跳转干脆利落。 不懂代码?
MINE_OS PhysicalPlatform操作系统内核原型
多核器的性能释放越来越猛,MINE_OS_PhysicalPlatform就冲着这股东风来了。作者脑洞挺大,想着把人工智能和数据挖掘塞进操作系统内核,让系统自己“学着用”,像量身定做一样服务用户。虽然现在还只是个原型,但基础已经打好了,核心部分是参考了《一个 64 位操作系统的设计与实现》那本书的代码,系统名字也挺有意思,叫 MINE——自己的。 编译环境比较传统,用的还是 CentOS 7 + GCC 4.8.5 + NASM 2.10.07。但也了,项目走的是稳定路线,没搞那些花里胡哨的依赖。代码结构清晰,写法也中规中矩,自己折腾不容易迷路。 如果你对 操作系统内核 感兴趣,尤其是想尝试点
CS224n中文笔记合并版含标签整理
问题的 CS224n 中文笔记整理,蛮适合做房价建模相关参考。全套内容不光翻译到了中文,还加了标签,逻辑清晰,查找也方便。像蛛网模型、灰色预测这种经典概念,解释得挺通俗,直接就能看懂。尤其对要用数学建模做城市房价预测的朋友来说,这份笔记省了不少资料整理的功夫,思路也顺了不少。
Web信息检索与Web数据挖掘
信息检索的基础瓶颈、数据挖掘的玩法思路,全都整理在这份《web 信息检索与 web 数据挖掘.pdf》里了。内容不长,但讲得挺系统,尤其是对比信息检索和数据挖掘那块,适合刚接触或者想把知识梳理清楚的你。像搜索结果太水、结构化难做这些老问题,它得蛮透的,而且还顺带说了怎么用挖掘技术去优化。智能搜索、推荐系统、舆情这些实际场景也有提到,接地气又不啰嗦。如果你正折腾搜索相关功能,拿来参考一下还挺值。
写给程序员的数据挖掘实践指南项目代码合集
数据挖掘实战项目的完整代码合集,覆盖从预到模型部署。适合有一定基础的程序员快速上手,用代码一步步吃透数据挖掘。
数据挖掘与分析实践入门
数据挖掘和是目前大热的技术方向,不仅能发现数据背后的潜在规律,还能为决策强有力的支持。如果你对数据挖掘有兴趣,几篇不错的文章可以你了解和实践其中的技巧。比如《城市销售数据技术探索——数据挖掘实践》,这篇文章深入浅出地了如何通过数据挖掘提升城市销售能力。要是你想了解数据本身的技术提升,可以看看《优化数据与挖掘技术》。至于 MATLAB 的应用实践,推荐《MATLAB 数据及应用实践》,它会你更好地利用 MATLAB 进行数据和建模。 这些资源看起来都挺实用的,适合初学者或者想进一步提升能力的人。只要你用心实践,肯定能在数据这块更上一层楼!
idmlib C++数据挖掘库
iZENECloud 的挖掘需求离不开这个库。idmlib是一个用 C++写的通用数据挖掘库,挺适合搞算法和推荐系统的开发者。嗯,像关键词提取、相似内容检测、分类生成这些,它都能搞定。关键短语提取那块,了两种方法,一个是基于翻译模型的思路,另一个用到了维基百科的数据,蛮有意思。 重复检测用的是SimHash,你要是搞过网页去重那套,肯定知道 Charikar 的方法。它这里设置了 64 维,够用了。再比如Ctr 预测、协同过滤、中文查询纠错也都覆盖了,功能确实全,是搞推荐系统那块。 协同过滤是基于项目的增量式算法,挺适合实时推荐需求的。如果你正想上手做一个推荐引擎,可以参考一下相关例子,比如协