任务详情
项目流程要实现的是:通过一段音频,推动一个原视频,使原视频中对应的人物口型和音频口型对应,推理过程满足一定实时性要求。
目前算法研究员已经把模型训练出来了,并且在python环境可以把流程跑通,需要做的事情是,把这个流程用C++重写,并优化模型推理链路,满足一定实时性要求。
职位要求:
1)熟练使用C++和python,熟悉pytorch,opencv等工具。
2)对算法模型压缩、加速、部署有过实际经验,熟悉onnx,tensorrt等工具。
3)具备CUDA编程经验和GPU优化经验。
4)熟悉基本的音视频开发知识,有过音视频处理相关的开发经验。
5)有实际的图像、音频相关算法落地经验。