职位描述
岗位职责:
1、基于公司产品特性,开展大语言模型(LLM)的场景化应用研究,针对业务需求与技术约束条件设计解决方案,并主导应用原型的开发与验证;
2、实施大模型选型评估,通过系统性测试体系对候选模型进行性能指标、推理效率及业务适配度的多维度评测,输出详实的测试分析报告;
3、主导技术转化工作,协同算法研发、产品设计与业务运营团队,将技术方案转化为可落地的工程实施方案,推进技术成果的商业化进程;
4、持续追踪大模型与AIGC领域的技术演进趋势,定期输出行业研究报告,推动前沿技术在现有产品体系中的创新应用。
任职要求:
1、计算机科学/人工智能/软件工程等相关专业本科及以上学位,具备持续跟踪大语言模型前沿技术的能力;
2、精通Python开发,具有3年以上代码开发经验,熟练掌握PyTorch/TensorFlow/PaddlePaddle框架中的至少一种,熟悉大模型基本实现原理;
3、深入理解NLP技术栈,掌握大模型微调、提示词工程、知识蒸馏、模型量化等核心技术,具有大模型部署优化经验者优先;
4、1年以上大模型相关的B端产品开发经历,完整参与过需求分析、系统设计到交付落地的全流程,具有数字政务/企业服务类产品经验者优先;
5、具有大模型产业化落地项目实操经验,主导过智能对话系统、企业知识库构建等典型场景案例经验者优先;
6、具备优秀的学习能力、技术敏感度及问题解决能力,能独立完成论文复现或开源项目优化;
7、具备良好的沟通能力和团队协作精神;
8、具有deepseek大模型应用落地经验的优先。