岗位职责:
1、负责VLA(视觉-语言-行动)多模态大模型在自动驾驶和机器人场景的前沿算法研究,涵盖场景理解、语义引导决策、时空建模等核心能力;
2、主导VLA端到端大模型的开发与优化,包括模型架构设计、数据处理、训练优化及车端部署,优化模型效率和精度,满足自动驾驶场景需求;
3、设计和优化多模态数据采集、清洗及增强策略,构建高质量训练数据集。
任职要求:
1、计算机科学、人工智能、机器人学等相关专业硕士及以上学历,熟悉DeepSpeed、FSDP、PyTorch等深度学习框架及分布式训练技术。熟悉机器人模仿学习、强化学习理论。
2、熟悉Transformer、Diffusion Model等架构,具备多模态大模型调优经验,熟悉数字孪生相关技术,熟悉多模态数据录制、回放等方法;
3、了解机器人运动控制(PID/MPC)、路径规划算法(A*/RRT/DWA)、运动/轨迹预测算法等,有自动驾驶数据集(nuScenes/Waymo)或机器人仿真平台(Isaac Sim)经验优先;
4、熟悉模型压缩、量化部署技术,有ONNX、TensorRT相关框架和开发工具使用经验优先。