过去20年来,统计句法分析与统计机器翻译在自然语言处理领域取得显著进展。除了成功借鉴统计句法分析的经验外,研究者们也开始尝试利用机器翻译模型进行文本生成。文本生成任务要求将形式语言转化为自然语言,与机器翻译的相似之处在于保持语义的一致性。Chiang提出了层级基于短语的翻译模型,采用同步上下文无关文法协调源语言解析和目标语言生成。此外,Lu与Ng的研究集中于类型化表达式,展示了构建形式语言树结构与自然语言树结构对应的一致性。国内自然语言处理研究较少涉及全面的汉语语义组合研究,尤其在意义到文本的生成领域仍有待深入研究。