文本挖掘是分析语义丰富文本以理解其内容和意义的过程,在数据挖掘中日益受到重视。定义了文本挖掘的基本框架,并深入探讨了预处理、文本摘要、文本分类、聚类、关联分析及可视化技术。详细总结了最新的研究进展,并展望了文本挖掘在知识发现和信息技术中的潜力。