我們的客戶正在尋找一位經驗豐富的資深 SRE,以提升他們的基礎設施並確保系統的高可用性、可靠性與可維運性。 * 負責維護和優化公司基礎設施 * 提升監控與警報機制,建立健全的可觀測性架構 * 支援區塊鏈基礎架構營運

你會做什麼:
作為我們的資深 SRE,您將在一個充滿挑戰和創新的環境中工作。您將負責設計和實現自動化系統,以提高維護效率並減少重複性工作。此外,您還將提升監控和警報機制,建立健全的可觀測性架構,以確保系統的穩定運行。您也將支援區塊鏈基礎架構的運營,提高區塊鏈節點管理的效能和可靠性。此外,您將協助內部技術團隊解決效能和可用性問題,確保開發和運營的順暢協作。最後,您將參與資安和合規專案,確保基礎設施符合監管要求和內部資安標準。

設計並實作自動化系統,提升維運效率,減少重複性工作
提升監控與警報機制,建立健全的可觀測性架構,確保系統穩定運行
維護與優化 Kubernetes 環境,包括升級、擴展、資源調整與效能優化
支援區塊鏈基礎架構營運,提升區塊鏈節點管理的效能與可靠性
協助內部技術團隊解決效能與可用性問題,確保開發與營運的順暢協作
參與資安與合規專案,確保基礎設施符合監管要求與內部資安標準

你帶來什麼:
作為我們的資深 SRE,您將帶來豐富的 SRE / DevOps 相關經驗,並具有獨立完成系統設計和實現的能力。您擁有程式設計能力,並精通 Go、Python、Shell Script 或其他相關語言。您熟悉公有雲平台(如 AWS、GCP 或 Azure),並有管理大規模雲端基礎設施的經驗。您也熟悉 Kubernetes,包括 Helm、Operator、Service Mesh 和 Auto Scaling。此外,您還熟悉基礎設施即程式(如 Terraform、Pulumi 或 CloudFormation),並具有 CI/CD Pipeline 的維護經驗。您具有監控和可觀測性相關經驗,並精通 Prometheus、Thanos、Grafana、OpenTelemetry 等工具。最後,您具有 Linux 系統管理能力,能夠進行效能優化和疑難排解。

具備 3〜5 年以上 SRE / DevOps 相關經驗,能夠獨立完成系統設計與實作
具備程式設計能力(Go、Python、Shell Script 或其他相關語言)
熟悉公有雲平台(AWS、GCP 或 Azure),有管理大規模雲端基礎設施的經驗
熟悉 Kubernetes,包括 Helm、Operator、Service Mesh 及 Auto Scaling
熟悉基礎設施即程式(IaC),如 Terraform、Pulumi 或 CloudFormation
具備 CI/CD Pipeline 維護經驗,如 GitHub Actions、ArgoCD 或 Jenkins
具備監控與可觀測性相關經驗,如 Prometheus、Thanos、Grafana、OpenTelemetry
具備 Linux 系統管理能力,能夠進行效能優化與疑難排解
了解分散式系統設計與網路技術,如負載平衡、網路協議、儲存系統

去原網站上申請

Senior SRE