职位描述
职责描述:
1. 负责语音方向的算法研究和开发工作,如语音增强、降噪、回声消除、语音分离、声纹识别、语音唤醒、语音识别(ASR)、语音合成(TTS)、语音克隆等;
2. 根据实际项目需求对算法进行适配,满足准确性和实时性的要求;
3. 设计语音数据采集、清洗及标注方案,构建高质量语音数据集;
4. 推动算法在嵌入式、移动端或云端平台的工程化部署,与工程团队协作完成产品集成。
任职要求:
教育背景:
计算机科学、电子工程、信号处理、人工智能等相关专业,硕士及以上学历(优秀本科生可放宽)
技术技能:
- 熟悉语音信号处理基础理论(如傅里叶变换、滤波器设计、梅尔频谱等)
- 精通Python/C ,熟悉主流深度学习框架(PyTorch、TensorFlow等)
- 熟悉语音处理工具库(如Kaldi、ESPnet、Librosa、WeNet)
- 熟悉多语种/方言语音处理技术
工作经验:
- 在声纹识别、语音分离、语音识别和合成等有实际项目经验,熟悉端到端语音处理流程
- 在语音领域会议/期刊(如INTERSPEECH、ICASSP、IEEE TASLP)发表论文者优先
软技能:
- 良好的逻辑分析能力与问题解决能力,对技术落地有强烈热情
- 优秀的团队协作与沟通能力,能快速理解业务需求并转化为技术方案