职位描述:
【岗位职责描述】
1、负责产品线对应的大数据存储平台hadoop、greenplum平台的高效稳定运行,总结输出自动化维护工具及文档,能以交付项目现场;
2、已有程序代码迁移转化(主要以sql、shell、python脚本为主);
3、分布式大数据平台与产品线其他模块的对接集成程序代码开发;
4、大数据平台对项目的支撑。
【基本条件】
1、本科及以上学历、计算机、通信等相关专业;
2、基于分布式数据处理(greenplum/vertica/gbase/hadoop)平台的实际开发应用和平台优化至少2年以上,深刻理解分布式数据处理平台的原理;
3、熟悉java、python、sql、hive、spark等开发语言;
4、实际从事分布式数据处理平台(hadoop、greenplum、gbase、vertica至少一种)开发工作时长至少在2年以上。
【必备知识】
1、精通sql【greenplum/postgresql、impala、oracle、mysql至少1种】、可融汇贯通灵活转换使用;
2、熟悉hadoop平台zookeeper、hdfs、spark、MR及hbase等常用组件的运行原理;
3、基于linux/unix平台进行shell、python的常用脚本开发。
【能力要求】
1、具备独力思考能力,能独立完成新需求独立模块及功能点的设计与开发;
2、较强学习能力,对新知识、新事情具备较强接收能力;
3、对数据敏感,喜欢大数据相关开源产品。
【素质要求】
良好的团队协作与沟通能力,态度端正,工作认真负责。