职位描述
岗位职责:
1. 负责企业级数据治理体系建设,包括数据标准制定、元数据管理、数据质量监控等;
2. 设计并实施数据资产管理方案,构建数据血缘图谱和分类分级体系;
3. 开发数据分析模型,通过数据挖掘发现业务洞察,支持决策优化;
4. 搭建数据质量评估体系,建立数据质量规则库和修复流程;
5. 制定数据安全合规策略,满足GDPR等数据监管要求 。
技术要求:
1. 数据治理核心工具
- 熟悉数据血缘关系 (元数据管理): pache Atlas/DataHub
- 熟悉质量校验规则 (数据质量 ): Great Expectation
- 熟悉主数据标准化(主数据管理): Informatica MDM/Talend
- 熟悉数据脱敏/访问控制(数据安全): Immuta/Privacera
2. 数据分析技术
- 熟练数据处理:SQL/Pandas/Spark SQL
- 熟练统计分析:R/Statsmodels/Scipy
- 掌握特征工程: Scikit-learn/XGBoost
3. 工程能力
- ETL开发:Airflow/Luigi流水线设计
- 数据仓库:Snowflake/Redshift/Doris
- 数据湖:Delta Lake/Iceberg
- 编程语言:Python/Java/Scala
任职要求:
1. 计算机/统计/数学硕士及以上,CDMP认证优先;
2. 3年以上数据治理或数据分析经经验(优秀应届生可放宽);
3. 扎至少主导过1个完整的数据治理、数据分析项目优先。