职位描述
工作内容:
1.负责京东信息安全大模型的应用研发工作,涵盖模型的持续预训练与优化、监督微调(SFT)以及强化学习等关键环节;
2.深入调研并积极探索大模型领域的前沿技术,包括先进的预训练方法、创新的 post-training 技术以及大模型强化学习技术;
3.参与大模型服务的部署实施,着力于模型量化处理和推理过程的加速优化,提升模型应用的性能和效率;
4.参与大模型在agent应用算法优化工作,提升agent任务执行效果;
任职资格:
1.有计算机科学、数学、统计学或相关领域的硕士或博士学位;
2. 熟悉Python与深度学习框架,具有良好的编程能力和扎实的数学理论基础;
3.熟悉掌握大模型相关技术,有实际主导或参与过大模型训练工作,包括不限于:预训练、SFT、强化对齐等;
4. 关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战自我;
5. 良好的沟通能力,跨团队协作能力,具备出色的规划、执行力,强烈的责任感,以及优秀的学习能力和自我驱动力。
加分项:
1. 有相关领域的开源项目、竞赛获奖、顶会论文发表/在投;
2. 熟悉DeepSpeed、Megatron-LM 、VeRL 、Unsloth 等LLM开源工具,具备大模型训练推理框架的优化以及开发能力。
3.熟悉大模型应用框架如Langchain等,工程能力较强;
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。