该数据集适用于使用Spark框架进行大规模数据TopN计算的场景。