数据挖掘报纸上的插图广告带有对象检测,这项工作属于Compagnon项目。该活动在2019年赫尔辛基数字人文黑客期间进行,得益于欧洲项目,利用了在法国传统期刊插图广告下构建的数据集。图显示了数据集的主要特征:1910-1920年期间,在法国期刊(主要是日报)中挖掘的65k插图广告数据,这些广告的期刊数据集从16种日常书目和15种杂志书目中收集了36,000册,265k页。也可以使用其他数据集(法语版,1920-1940)。物体检测Yolo v3已应用于广告图像(请参阅图像检索上的面部和物体检测部分)。使用了七个运输类:自行车,汽车,摩托车,飞机,火车,卡车,船。Yolo v3生成了17.5k注释(在运输类别的手段上为1400)。Yolo v3在推断传统报纸广告上的对象时可能会遇到一些问题。