职位描述
1、参与具身智能 LLM 技术体系架构设计,决策多模态感知(视觉、触觉、力觉)与 LLM 融合的核心方案,攻克语言 - 动作语义断层、动态环境决策泛化性不足等问题。
2、负责LLM相关文本预处理全流程开发及输出(如长文本截断、多模态数据对齐等),进行底层数据清洗及仿真训练,适配模型输入要求。
3、参与搭建高可用大模型服务架构,解决多模型协同、跨平台部署等工程问题,支持云端与边缘设备的灵活部署
1、了解LLM 底层架构( Transformer、GPT-4、LLaMA 3 系列),知晓 LLM模型预训练、微调、部署全流程。67
2、掌握Python、C 基本编程,具备一定的代码开发量;
3、有ROS2 机器人操作系统,了解DeepSpeed、Megatron-LM 等分布式训练框架。
博士、硕士学历,计算机科学与技术、机器人学、数学、统计学等相关专业,有大模型研发或落地项目经验优先。