本项目通过Gibbs采样推理实现LDA(潜在狄利克雷分配)。
优势:
- 契合度
- 加速Gibbs采样过程
参考:
@article {heinrich2005parameter,title = {用于文本分析的参数估计},作者= {Heinrich,G.},journal = {Web:,year = {2005}}}
注意:
- Gibbs采样速度较慢,难以检查收敛性。
- 结果不佳,可能是语料库规模较小所致。
- 不同运行的结果可能有很大差异。
主题建模工具:
- David Blei的收藏
- UMass的Mallet
- 斯坦福主题建模工具箱
- Mark Steyvers和Tom Griffiths编写的MATLAB主题建模工具箱
- LDA-J
- R包
- topic-modeling-tool(基于Mallet的图形用户界面工具)