岗位职责
1.负责大语言模型及多模态大模型的预训练开发和调优工作,
2.负责基于大模型的机器人控制算法设计、训练、数据集处理、及真机部署测试.
3.负责大樘型训练效率提升,如:模型并行、flash attention、LoRA:
4.负责跟进领域最新进展,预研和评估大模型在机器人领域的应用,如RT系列等
任职要求
1.熟练掌握大语言模型及多模态大模型相关的网络结构及训练方式;
2.熟练Pvtorch/Tensorflow深度学习框架,掌握Pvthon/C 至少一种编程语言
3.熟练掌握常见的分布式训练框架,以及大型高效微调技术
4.熟练应用云端算力展开大规模教数据处理及训练:
5.精通常见模仿学习算法(如:ACT、DP等)及Model-Based RL算法者优先
6.精通模型与机器人硬件接口布置者优先:
7.曾在A1、CV、NLP顶会、顶刊(如:TIP、TRO、CVPR、ACL等)发表论文者优先