基于SO-PMI算法的情感极性判别代码,含有易于理解的注释。针对2元词组共现频率为0的情况,参照相关论文提出了goodturing平滑和laplace平滑方法。建议使用时限制训练数据不超过80000条,以避免运行速度过慢。