职位描述
岗位职责:
1、参与设计、开发和持续迭代算法平台加速功能,主要是大模型推理场景,提高性能和效果,
2、持续跟进业界大模型加速技术进展,促进相关技术在算法平台快速落地:需定期进行调研成果汇报及技术交流:
3、负责新技术测试、验证、转化、创新:
4、支持用户使用算法平台加速功能,编写操作文档;梳理用户痛点,持续优化平台功能:
岗位要求:
1、硕士及以上学历,计算机科学、人工智能、统计学或相关领域背景优先;
2、扎实的编程能力,熟练Python、C/ 等编程语言;熟悉cuda编程者优先,熟悉openai triton编程者优先。
3、对自然语言处理、机器学习和深度学习技术有浓厚兴趣,具备相关的学术基础。
4、熟悉常见的NLP工具库和模型(如Pytorch;Transformers、Bert等)者优先
5、在模型加速领域的论文发表或开源项目经验者优先。熟悉常见大语言模型,如熟悉deepseek的加速机制者优先,有模型加速项目开发经验者优先。对容器化部署技术有一定了解,熟悉docker/k8s者优先;
6、具有自驱力,以开放心态积极接受新知识,以利他精神为团队贡献,以务实态度追求实际成果。