职位描述:
岗位职责
1、 设计、构建并维护高性能数据仓库;
2、 开发优化ETL流程,确保数据准确性和实时性;
3、 优化大数据平台脚本的计算效率。
4、 根据业务需求设计星型/雪花模型、维度建模等;
5、 使用Erwin/PowerDesigner等工具完成数据模型设计;
6、 具备全链路数据开发能力,负责数据仓库、数据湖等数据全生命周期开发;
7、 制定数据开发规范,提升数据资产质量。
职位要求:
1、 本科及以上学历,软件工程、计算机、数据科学与大数据技术、信息与计算科学、数学等相关专业,985/211优先;
2、 5年以上复合型数据领域经验(需同时覆盖数据分析、数仓建模)
3、 逻辑清晰,具备跨团队协作和复杂问题解决能力。
4、 有数据质量分析、主数据建模等项目经验优先;
5、 熟练使用Hadoop、Spark、Hive、Kafka等大数据技术;
6、 精通SQL及性能调优,有ETL pipeline开发经验;
7、 精通数据仓库理论(Kimball/Inmon方法论);
8、 熟练使用Erwin/PowerDesigner等工具;
9、 有制造业等领域数仓建设经验者优先。