职位描述
工作职责
1、主导多模态算法和模型的研究与开发,包括但不局限于文本/图像、文本/视频、文本/音频等跨模态算法研发和优化,输出行业领先的技术解决方案;
2、推进多模态内容理解与生成的技术,通过整合不同模态的数据(如文本、图像、声音、视频等),实现跨模态的信息提取和融合,使模型能够更全面地理解复杂场景或任务,从而提升推理和决策的准确性。
3、探索多模态/NLP/CV等方向的AI前沿技术,承担***/省部级科研课题,输出高价值成果;
工作要求
【能力素质】
1、诚实、正直、有责任心,认同企业文化;
2、熟悉Python/C/C 开发,熟悉Linux开发环境,能够运用OpenCV实现常用的图像处理算法;
3、基于GPU平台,熟悉Tensorflow、mxnet、PyTorch等至少一种深度学习框架;
4、熟悉CV