过去十年中,利用大数据推动科学发现的理念引发了来自私营和公共部门的巨大热情和投资,并且预期仍在持续增长。使用大数据分析来识别隐藏在从未组合过的海量数据中的复杂模式可以加速科学发现的速度,并促进有益技术和产品的开发。然而,从如此庞大、复杂的数据集中产出可操作的科学知识需要能够产生可靠推论的统计模型 (NRC, 2013)。