TagRelator：基于Java的词语语义相似度计算项目

TagRelator项目源于大学编程课题，其方法基于特定论文研究成果。项目核心目标是计算词对的语义相似度得分，例如“猫-老虎”得分较高，表明概念相似，而“猫-石头”得分较低。

项目利用大量文本数据进行统计分析，自动计算得分。其假设是语义相似的词拥有相似的上下文，即文本中出现的后续词语。因此，项目需要大量文本数据以查找目标词及其上下文。

项目采用两种度量方法计算词对相似度得分：逐点互信息（PMI）和二阶共生PMI（SOC-PMI）。项目基于论文方法进行开发，并应用于Flickr照片标签领域，包括数据收集和存储的实现。

项目以Java语言开发，整体使用，部分类可独立使用。