SVHN_Classic挑战:主要利用经典的图像处理和计算机视觉技术,在没有神经网络的情况下为SVHN数据集实现了优秀的分类器。解决方案:通过MSER功能和数字边界框的笔划宽度变化检测每个图像中的数字,并使用K最近邻方法进行分类。在验证集上,平均F1得分达到80%。运行文件顺序:使用Matlab的detect_text.m提取每个图像中每个数字的边界框。图像来自“额外” tar数据集。使用Python 3的convert_to_h5py.py转换digitStruct.mat中的训练集数据。使用Python 3的train_svhn.py训练分类器并保存模型。通过混淆矩阵结果选择最佳模型,选择k = 31的k个最近邻居。验证集上的最佳F1分数平均为80%。保存了模型“ knn_svhn.pkl”。