通过词频、词增长率和TF-PDF算法提取突发词集合,利用突发词表示文本,结合微博突发事件描述特征进行文本过滤,并提出“绝对聚类”算法对突发事件文本进行聚类。根据微博回复和转发数加权计算热度,检测各事件中热度最大的突发事件,有效检测微博突发事件。
微博突发事件检测研究
相关推荐
基于突发事件热度的站点地图构建算法研究
为了更有效地获取监测网站上的突发事件舆情数据,本研究提出了一种基于突发事件热度的站点地图构建算法。该算法利用突发事件主题词典和改进的 Shark search 算法采集样本网页,并在此基础上对目标网站的超链接结构进行数据挖掘,构建包含网站各版块突发事件热度的站点地图。使用该站点地图,网页采集器能够及时调整更新频率,准确采集所需网页,更好地适应监测网站的动态变化。实验结果表明,在站点地图的指导下,突发事件相关网页的采集有效性和效率均得到显著提升。
数据挖掘
16
2024-05-20
基于微博数据挖掘的突发事件舆情演化分析——以艾尔玛飓风为例
基于微博数据挖掘的突发事件舆情工具,挺适合做情感传播研究的朋友用来练手。以艾尔玛飓风为例,结合微博的时间线数据,能看出负面和正面情绪的信息传播路径,逻辑还挺清晰的。适合你在做情感倾向、突发事件传播建模的时候参考。里面方法不复杂,主要靠分类、可视化和传播路径推理。对了,想做更深入的数据,可以配合 MRForWeibo 一起用,效率高不少。
数据挖掘
0
2025-06-29
ULLDA模型微博主题挖掘改进研究
微博文本的高维稀疏,老实说,用传统方法真挺头疼的。LDA 模型这种主题模型就派上用场了,不过嘛,原始 LDA 没考虑用户个人特征,用在微博上多少有点水土不服。于是有了ATM 模型,加了作者维度,想法挺好,但微博这种地方,转发、互动多,单一作者假设就有点扯了。你说一个热门话题,哪能只有一个人说事?ULLDA的出现算是补上了这块短板,它支持多个作者“贡献”同一条微博内容,还考虑了微博的传播结构,比如用户关系、话题热度啥的。挺聪明,挺实用。模型跑在NLPIR 数据集上,结果也给力,比 ATM 强不少。要是你正好做微博相关的挖掘任务,比如用户画像、话题追踪、推荐系统,这个 ULLDA 模型值得一试。哦
数据挖掘
0
2025-06-25
微博用户偏好驱动的信息传播研究
在Web社会网络分析中,分析用户行为及偏好是关键课题之一。以微博为例,通过对用户历史行为的统计分析,提取影响决策的因素,并定性分析它们之间的关联关系,以揭示用户潜在的偏好。利用CP-nets偏好表达工具建立用户偏好模型,有效表达各因素之间的偏好关系,并导出最优特性,帮助用户进行信息转发决策。
统计分析
10
2024-07-13
TrustRank微博用户影响力评估研究
微博用户影响力的评估,TrustRank 算法的微博应用,挺有意思的一篇研究论文。不是只看粉丝数量那种老一套,而是把用户之间的关注关系当作一张图,用类似“好人不关注坏人”的思路来推算谁才是真正有影响力的账号。过程用到了图论、概率矩阵还有数据挖掘这些老朋友,重点在于识别“高质量用户”和甄别“僵尸粉”。要是你最近在做和社交网络、用户排名相关的项目,这篇文章值得一读。
数据挖掘
0
2025-06-24
微博评论情感标注
自然语言情感分析主要应用于微博评论,通过算法识别用户情感倾向,帮助了解公众情绪动态。利用机器学习模型,系统能高效分类情感类别,提高数据处理效率。
算法与数据结构
11
2024-07-12
Java Web 微博项目源码
这是一个基于JSP和Servlet的简易微博项目,涵盖了图片上传、MySQL分页、JSTL以及数据库设计等功能,适合Java Web入门学习。
MySQL
18
2024-05-15
新浪微博Redis实践案例
新浪微博的 Redis 实践,蛮值得一看。高并发下的用户关系、实时计数器这些典型场景,都用得挺巧。像好友关注这种高频操作,他们用的是 Redis 的Hash结构,查粉丝、加关注都能迅速响应,MySQL 真扛不住这么搞。微博点赞、评论的实时计数,他们也搬到了 Redis 里,用incr、hincrby做增量更新,既快又稳。像“小黄签”的提醒功能,还用到了Set和Sorted Set,查新粉、新@那叫一个顺畅。数据一致性也考虑得比较周全。比如微博总数这些数字,他们会定时从 Redis 同步回 MySQL,既保证了快,也不丢数据。还有AOF/RDB的持久化策略、Sentinel做高可用,这些方案都提
Redis
0
2025-06-15
微博内容定向采集工具
微博内容定向采集工具
这款工具能够根据您指定的关键词和日期范围,精准抓取微博平台上的相关内容,助力您进行舆情监测、市场调研、竞品分析等工作。
主要功能:
关键词设定:支持设定多个关键词,并可选择包含任意关键词、包含所有关键词或排除特定关键词等匹配模式。
日期范围选择:可设定具体的起始日期和结束日期,精准锁定目标时间段内的微博内容。
数据导出:支持将采集到的微博内容导出为多种格式,方便您进行后续分析和处理。
使用场景:
品牌监测:追踪品牌相关话题的讨论热度和舆论走向,及时了解消费者反馈。
热点事件追踪:快速收集特定事件的相关微博内容,把握事件发展脉络和舆论动态。
市场调研:了解目标用户群体
数据挖掘
17
2024-04-30