CCKS2017(Chinese Clinical Knowledge Service Challenge)是专注于医疗信息处理的竞赛,其任务2专注于病例标注,推动医疗自然语言处理技术的发展。该数据集包含丰富的临床病例信息,为研究者提供宝贵资源来训练和评估文本标注模型,特别在疾病诊断、治疗方案推荐和病历理解方面。数据格式设计结构化,便于机器处理和分析。每个病例被划分为四个主要领域:一般项目、病史特征、诊疗过程和出院情况,文件类型包括文本和结构化数据,如PDF、TXT、CSV和XML,保留了原始语境信息和计算可行性。