StyleGAN2 生成乳腺超声图像数据集,用于 AI 诊断成像的监督训练

本研究利用 StyleGAN2 生成合成乳腺超声图像,构建用于 AI 诊断成像监督训练的数据集。

数据集构建流程:

  1. 影像准备: 将乳腺超声图像分为训练集和测试集。测试集包含 150 张良性和恶性图像,其余图像随机分配到训练集。图像格式:BMP 用于分类,PNG 用于图像生成。所有图像尺寸为 256x256。理想情况下,图像数量应达到 10,000 张以上,但 1,000 张以上即可进行合成。
  2. 使用 InceptionResNetV2 训练真实图像: 利用真实图像训练 InceptionResNetV2 模型。
  3. 通过 StyleGAN2 生成合成图像: 利用 StyleGAN2 生成合成乳腺超声图像。
  4. 基于训练好的真实图像模型选择合成图像: 使用训练好的 InceptionResNetV2 模型筛选高质量的合成图像。
  5. 使用合成图像训练 InceptionResNetV2: 利用筛选后的合成图像训练 InceptionResNetV2 模型。
  6. InceptionResNetV2 测试及模型比较: 使用测试集评估 InceptionResNetV2 模型,并进行统计分析比较不同模型的性能。

图 1. 整体工作流程图