职位描述
【岗位职责】
1、负责大模型技术团队的建设与管理,制定技术路线与研发规划;
2、主导大模型预训练、微调、推理优化、领域适配等核心技术研发;
3、推动分布式训练框架、高效微调(如LoRA)、模型压缩等前沿技术攻关;
4、探索多模态大模型、Agent系统、模型安全对齐等创新方向;
5、跨部门协作推进技术落地,实现业务场景的规模化应用;
【岗位要求】
学历背景:计算机科学、人工智能等相关领域硕士及以上学历,2年以上AI研发经验;
技术能力:
精通Transformer、MoE等模型架构,熟悉PyTorch/TensorFlow等框架
具备千亿参数级大模型训练调优经验,熟悉Megatron/DeepSpeed等分布式框架
掌握RLHF、Prompt Engineering、模型评估等全流程技术
有AIGC、Agent系统或多模态大模型研发经验者优先
行业视野:对LLM技术趋势有深刻理解,在顶会(NeurIPS/ICML/ACL等)发表论文者优先;