最新实例
Weka 3.8.2数据挖掘工具
Weka 3.8.2 的跨平台数据挖掘工具挺适合那些想搞点机器学习的开发者。支持 Mac,运行流畅,功能全。它内置了一堆机器学习算法,比如分类、回归、聚类、关联规则啥的,用起来方便。不管你是拿来 CSV,还是配合 SQL 数据库,这工具都能派上用场。 另外,界面虽然不是那种花哨类型,但还蛮直观的,新手上手没啥压力。尤其是它的可视化功能,数据分布、模型预测啥的都能一目了然。哦对了,文档也比较详细,遇到问题直接翻官方,基本都能。 如果你正在找个能快速验证模型的工具,或者需要一个能帮你批量数据的工具,可以试试 Weka。这里还有几个相关的资源链接供你参考。
卷积神经网络文字识别应用
卷积神经网络的文字识别,挺适合拿来练手的。以前做字符识别,要先手动提一堆特征,再挑挑拣拣去优化,特征选得不好,分类就不准。现在直接上CNN,自己学特征,省心多了,效果也还不错。 以前做图像那一套流程——先预,再提特征,再分类,步骤不少,还挺吃经验。有时候预图像质量不高,后面整个流程都拉胯。用卷积神经网络,基本就一个模型搞定前中后,训练好了之后识别效果蛮稳定的。 我比较推荐几个资源,你要是想系统学一下,看看这些链接还挺值: 图像模式识别特征提取数据挖掘资源包 基于简单卷积神经网络的模式识别精度评估 神经网络模式识别 MATLAB 实现合集 神经网络模式识别的 Matlab 开发
浙工大850数据库真题与答案
浙工大的 850 真题和答案,整理得还挺完整的,适合备考时候拿来刷题练手。题型分布也比较经典,尤其适合刚入门数据库系统、Access、Oracle 方向的同学用来找感觉。你要是考 850,先从这里刷起没错。 蛮多同学搞不清 850 考什么,其实主要是数据库基础+SQL+一些大数据概念。这份资料里,像Access和Oracle的部分,基本上都是历年真题,有题有解答,直接看懂思路比闷头啃教材强多了。 顺手也找了几个类似资源,一块看更有。比如Access 真题答案解析(点这里),或者大数据考试真题(这个也不错),都是靠谱的整理。 如果你想补一下图形化数据库工具相关的操作,建议搭配练练Access建表
市场研究数据分析方法
线性回归的统计检验、判别的使用方法、SPSS 的数据流程……这些在市场研究里啊,都是挺常见也挺实用的套路。蛮推荐你看看《市场研究中的数据方法.ppt》,讲得挺全的,像线性回归、判别这些方法都讲了怎么用。尤其对搞市场调查或用户调研的朋友,思路会打开不少。比如你想用SPSS跑一波问卷数据,不知道从哪下手?可以先瞄一眼里面提到的流程,比较适合刚入门或者想梳理框架的人。想看更详细操作,也可以顺手翻翻这篇:SPSS 11.0 市场研究数据,配合食用更香。再说判别吧,用来区分人群画像那种场景挺合适。比如你想看看“回购用户”和“一次性用户”到底差在哪,就可以用它做点分类实验。这篇文章讲得还不错哦:线性判别概
蚁群算法原理与应用简述
蚁群算法的模拟机制还挺有意思的,用的是蚂蚁找食物的思路,但套在优化问题里效果还蛮好。像是路径优化、调度问题这些,它都能搞定。你不需要全局控制,算法自己就能慢慢逼近最优解,而且还能避免陷入局部最优,挺聪明的。信息素机制是它的关键,浓度越高,路径就越容易被选中,还能通过蒸发机制防止早早固定住结果,保持灵活性。如果你是搞TSP、路径规划或者组合优化相关的,这份 PDF 你可以看看,讲得挺系统,还提到了各种变种模型,比如Ant-Cycle、Ant-Density、Ant-Quantity,用在哪、怎么调参,都给了点思路。哦对,里面还带了几个相关资源链接,像Matlab下怎么实现、信息素轨迹初始化、甚至
2020年全国大学生数学建模竞赛题目C中小微企业信贷决策建模范例
中小微企业信贷决策的建模案例,得细,连代码都有,真是太贴心了。用的是梯度提升决策树和非线性规划,预测准确率干到了 96%以上。关键是模型结构清晰,不是那种一看就犯困的。还挺适合拿来练手或者参考的。 模型用到的数据挖掘部分也蛮实用,对企业的票据数据得挺深入,而且还改进了传统的决策树算法,加了正则项控制复杂度,再结合集成学习做叠加优化,整个流程一套一套的,响应也快,预测也稳。 你如果也在做信贷评分或者跟多目标优化相关的项目,建议看看这个,尤其是模型怎么从数据清洗一步步推到策略输出,逻辑清楚。还附了源代码,用起来也方便,修改下参数就能跑出结果。 值得一提的是,论文还对 302 家没有信贷记录的企业做
自适应滤波器设计Matlab图像去噪项目
自适应滤波器的设计资料,讲真,挺实用的。既有完整的Matlab和Visual C++实现代码,又配套了详细报告。做图像项目的时候,碰上各种奇葩噪声,用一般滤波方法真不一定搞得定。这里讲得清楚:什么时候该用自适应滤波、该选哪种,甚至对比都给你整明白了。 图像去噪的痛点,就在于噪声种类太多了,比如椒盐噪声、高斯噪声、还有那种你都不知道咋来的杂波。用错方法,结果还不如不动。这个项目蛮贴心,不光有AWMF、LMS这些主流算法的实战代码,还带着文献教你怎么选型。 Matlab 图像滤波部分的代码比较清晰,函数封装得也不错,适合直接拿来跑,或者根据自己的项目稍微改一改。像维纳滤波、中值滤波这些经典方法也都
数据仓库工具箱维度建模权威指南3.0中英双语版
维度建模的老牌经典,《数据仓库工具箱》第 3 版,真的蛮值得一读。Kimball 的那一套思路,不管你是初学者还是搞了几年数据仓库,读起来都有收获。中英双语版本也贴心,适合不同阅读习惯的你。讲的内容也挺接地气,案例多,思路清晰,适合项目实战参考。设计事实表和维度表的时候,哪种模型合适、哪些细节容易踩坑,它都说得比较透。嗯,如果你最近正好在搞 DW/BI 建模,建议这本直接收,不会错。
KNN疾病预测Demo
KNN 的疾病预测 Demo,真的是初学者练手的好项目。用的是 Python,数据直接从 Excel 读,配合pandas和scikit-learn起来挺顺的,逻辑清晰、代码不多,重点都在 KNN 算法上,理解了它怎么选邻居、怎么投票,预测也就不难了。嗯,模型部分其实挺“懒”的,训练过程就是把数据记住,预测的时候再去找“最像”的邻居。 Excel 的病历数据也蛮直观的,像身高、体重、血压这些都作为特征喂给模型,如果你做过数据的话,这部分应该熟。前面数据清洗那块建议重点看下,标准化、缺失值啥的不能忽略,不然预测结果偏差挺大。 KNeighborsClassifier这个类是重点,你会看到fit和
算法设计与分析最优二叉搜索树动态规划讲解
最优二叉搜索树的 PPT 讲得还挺清楚的,尤其是动态规划那块,思路拆得细。如果你平时喜欢研究搜索策略,或者搞算法课设,这份资料真能帮你少踩不少坑。思路清晰,推导过程也不绕,挺适合边看边动手写代码练练的。