经验要求:8年以上生物信息学开发经验,5年以上云平台架构经验
核心优势亮点
1.高性能计算与云平台架构
- 主导搭建国家基因库Hadoop/Spark大数据平台、天津天河超算集群等,支持PB级数据计算
- 精通AWS/华为云等云平台生信环境部署,实现动态资源调度与成本优化
2.算法工程化与极致优化
- 具备极致的程序运行优化思想,并有相关的案例。
3.独立云平台开发能力
- 从0到1构建生信自动化分析平台。
岗位职责
4.云原生生信平台架构
- 设计基于Kubernetes的分布式计算框架,支持AWS/Azure/GCP多云环境自动扩缩容
- 优化Spark/Hadoop集群资源利用率,开发Serverless计算管道应对突发任务
5.高性能算法开发
- 主导基因组比对、变异检测等核心算法研发,要求TB级数据处理时效性达小时级
- 实现Python/C 混合编程优化,关键模块响应延迟控制在毫秒级(需提供性能压测报告)
6.工程化体系建设
- 建立CI/CD自动化测试体系,要求万级QPS压力下系统可用性≥99.99%
- 制定代码性能审查标准,将Big-O复杂度分析纳入开发规范
7.技术攻坚与团队赋能
- 解决EB级数据存储/计算瓶颈,主导GPU加速、近似算法等前沿技术预研
- 培养3-5人技术团队,输出高性能计算最佳实践手册
硬性要求
8.技术栈深度
- 语言:Python(Cython/Numba优化)
- 大数据:Hadoop/Spark/Flink,HBase/Redis
9.性能指标背书
- 至少1个TB级数据优化案例(如计算耗时压缩50% ,单位成本下降40% )
- GitHub需展示性能攻坚代码(如开源工具加速模块)
10.领域知识
- 精通代谢组学,蛋白等多组学生信分析。