任务详情
能力要求:
计算机相关专业, 5 年以上运维/SRE/DevOps 经验,其中 3 年以上链相关行业运维经验。
熟练掌握 Linux 、网络协议、Docker 、Kubernetes 及主流中间件( MySQL 、Redis 、Kafka 、Elasticsearch 等)。
精通 IaC 工具集( Terraform 、Ansible 、Helm )、CI/CD 管道( Jenkins 、ArgoCD )。
熟悉 Prometheus/Grafana/Alertmanager/Fluentbit/ELK 等监控日志系统,能设计 SLO/SLA 。
熟悉 AWS/GCP/AliCloud 公有云部署和网络运维经验,具备混合云高可用方案能力。
熟悉链同步监控、RPC 、Indexer 、跨链桥、撮合系统等链上关键模块。
熟练编写脚本/代码( Shell/Python/Go 等)用于服务编排和平台工具开发。
沟通协调能力强,能与多个团队建立合作,推动运维标准落地与改进。
岗位职责:
负责公司 去中心化系统的整体运维,包括微服务架构、分布式组件及区块链节点的部署、监控与稳定性保障;
深度参与以太坊、BSC 、Cosmos 等链的节点运维、RPC 服务、索引服务部署与优化,确保区块同步与高可用访问;
支持交易系统与链上服务的高并发、低延迟需求,保障撮合、钱包等核心业务模块的运行效率;
搭建并优化 CI/CD 流水线,实现服务的自动化部署、版本管理与灰度发布;
维护 Kafka 、Redis 、Elasticsearch 等大数据与中间件平台,提升系统观测性与故障定位效率;
统一建设监控、日志与告警体系(如 Prometheus/Grafana/ELK ),制定运维规范与应急预案;
实施权限控制、网络隔离、备份恢复与安全防护措施,配合安全与合规策略落地。