职位描述
岗位职责:
1、负责音频声纹和AI声音鉴伪,音频生成ASR等相关算法的选型及构建,关键技术攻关、核心模块的编写;
2、设计和开发各种音频信号处理算法,如噪声消除、回声消除、语音增强、声音检测等。优化这些算法的性能和效率,提高音频处理的质量,分析和解决音频处理过程中的问题和瓶颈,并基于深度学习的音频AI应用开发:
3、研究和应用深度学习技术在语音识别、音乐分析、声纹识别等领域的应用,开发能商用的基于深度学习的音频分类、检测、生成等AI模型,优化和并行部署这些AI模型,确保在实际应用中的性能和可靠性。
4、负责模型后续的验收测试和后续的的带优化。
任职要求:
1、熟悉Numpy基础框架,熟悉PyTorch/Tensorflow/Keras/JAX等一种多多种框架;
2、掌握音频媒体常用的编解码技术原理,并对常见的音频分类检测等算法非常熟悉,深入研究Wav2Vec算法的优先;
3、主导开发过基于音频AI技术的相关商用产品。