职位描述
岗位职责:
1.主导大语言模型、多模态模型的算法研发,重点通过数据清洗、特征工程与数据分析提升模型性能与泛化能力。
2.设计并优化数据预处理流程,构建高效数据管道,支撑模型训练与迭代。
3.针对业务场景设计数据适配方案(如智能客服对话数据挖掘、内容生成质量评估、多模态数据对齐等)。
4.探索数据增强、迁移学习等技术,提升小样本场景下的模型效果。
5.熟练运用LangChain等工具构建数据交互模块,开发自动化数据处理、分析及可视化工具。
6.基于PyTorch/TensorFlow等框架实现数据高效加载与分布式训练优化。
7.通过数据分析定位模型瓶颈,提出改进方案并推动落地。
任职要求:
1.计算机/数学/统计学相关专业本科及以上学历,2年及以上算法或数据科学经验。
2.扎实的数据处理能力:精通Python及Pandas/NumPy/SciPy等生态,熟悉SQL/NoSQL数据库操作。
3.深入理解数据与模型的关联:掌握特征工程、统计分析、AB测试方法论,熟悉Transformer/BERT等架构的数据处理特性。
4.大数据处理经验:有TB级数据清洗、分布式计算(Spark/Dask)或数据湖管理经验者优先。
5.熟悉大模型训练中的数据优化策略(课程学习、动态采样等),具备模型压缩与数据高效利用经验。
6.有数据可视化(Matplotlib/Tableau)或MLOps工具链开发经验者加分。
7.强数据敏感性:能从复杂数据中提炼洞见,具备将业务问题转化为数据问题的能力。
8.逻辑清晰,具备独立技术攻关能力,对数据挖掘与模型优化有持续热情。