这份文件包含了基于句子描述视频的基础语言学习代码,由Haonan Yu和Jeffrey Mark Siskind在ACL 2013上发布。该算法核心来自普渡大学CCCP小组,基础设施主要由DARPA Mind's Eye计划在南卡罗来纳州的普渡大学-多伦多大学开发。