本项目通过Gibbs采样推理实现LDA(潜在狄利克雷分配)。

优势:

  • 契合度
  • 加速Gibbs采样过程

参考:

@article {heinrich2005parameter,title = {用于文本分析的参数估计},作者= {Heinrich,G.},journal = {Web:,year = {2005}}}

注意:

  • Gibbs采样速度较慢,难以检查收敛性。
  • 结果不佳,可能是语料库规模较小所致。
  • 不同运行的结果可能有很大差异。

主题建模工具:

  • David Blei的收藏
  • UMass的Mallet
  • 斯坦福主题建模工具箱
  • Mark Steyvers和Tom Griffiths编写的MATLAB主题建模工具箱
  • LDA-J
  • R包
  • topic-modeling-tool(基于Mallet的图形用户界面工具)