职位描述
职责描述:
1. 负责公司数据闭环体系搭建,处理亿级数据量,为端到端模型训练提供数据产线支持;
2. 主导数据闭环工具链研发,加速自动驾驶模型迭代,职责涉及以下方向:
2.1 数据筛选器:开发车端热更新筛选器和影子模式,设计并实现触发逻辑,打通云端配置到车端链路;
2.2 数据录制及上云:车端数据录制,包括原始数据封装、压缩、加偏、脱敏、加密等,打通车云上传链路;
2.3 云端数据处理:对于标注数据、场景数据,开发数据清洗、编解码、自动打标、高价值数据挖掘、数据检索、评测等自动化工具,适配自动驾驶模型数据pipeline.
3. 基于云资源和图商合规云体系的数据闭环:基于云上资源构建标注、训练平台,并完成智驾算法的适配对接和数据pipeline开发。
任职要求:
1. 本科及以上学历,专业方向包括计算机、软件、自动化、模式识别等理工科,工作经验不小于2年;
2. 具备较强的编程能力,精通Python及C 语言,熟悉Linux操作指令及SQL数据库,有良好的编程习惯和标准化的代码风格;
3. 熟悉自驾数据工厂的流程体系,理解数据工厂各项功能的用途,具备一定的数据工厂的产品定义能力;
4. 熟悉自动驾驶涉及到的各类传感器的原理及数据特点,具备主要传感器数据的处理经验,熟悉H264、YUV等常见的编解码方式,加分项:有定制数据格式的经验;
5. 熟悉常见的自动驾驶中间件,包括不限于ROS2、DDS、some/ip、ZMQ等。加分项:有中间件开发及在SoC上的部署经验;
6. 熟悉 TCP/IP 网络协议及相关编程,熟悉进程间通信及多线程编程;
7. 熟悉数据自动打标原理及开发流程体系,加分项:有NN模型开发、部署经验;
8. 踏实靠谱,具备良好的团队内及跨团队沟通能力。