任务详情
计算机视觉方向,任务是针对篡改场景文本检测(tampered text detection),在 MMDetection/YOLOv3 框架基础上实现 RGB 分支 + 频域分支 双分支融合架构。项目现有可运行的 YOLOv3 检测工程骨架(可训练/评估),需要在此基础上完成双分支融合模块的实现、模型训练、优化和评估。目标性能要求 F1 分数不低于 0.85。
【技能要求】
熟悉 YOLO 系列算法(YOLOv3 及其改进版本)与 MMDetection 框架。
熟练掌握 PyTorch*深度学习框架,具备独立调试与优化模型的能力。
了解频域处理(如 FFT、DCT)及其在图像特征提取中的应用。
熟悉目标检测评价指标(Precision、Recall、F1-score 等)。
具备良好的代码规范习惯,能按时交付任务。
价格可议,不少于3000