Rol
Mono’nun yönettiği Linux, Kubernetes ve bulut platformlarında güvenilirlik, izleme ve olay müdahalesi süreçlerini tasarlayacak bir Site Reliability Engineer arıyoruz.
Sorumluluklar
- Linux ve Kubernetes üretim ortamlarının operasyonu.
- SLO, alerting, runbook ve incident response süreçlerinin tasarımı.
- Grafana, Prometheus/VictoriaMetrics, Loki ve OpenTelemetry tabanlı gözlemlenebilirlik.
- Ansible / OpenTofu ile otomasyon.
- Müşteri ekipleriyle teknik kök neden analizi ve iyileştirme planı.
Aranan nitelikler
- Linux üzerinde güçlü troubleshooting deneyimi.
- Kubernetes networking, ingress, storage ve deployment pratikleri.
- En az bir gözlemlenebilirlik yığınıyla üretim tecrübesi.
- Yazılı iletişim ve dokümantasyon alışkanlığı.
- On-call kültürü ve blameless postmortem yaklaşımına açıklık.
Artı değer
- PostgreSQL / Redis / Kafka operasyon deneyimi.
- Cilium, Istio, Linkerd veya benzeri ağ/policy araçları.
- Cloudflare Workers / Pages veya edge platform tecrübesi.
Başvurmak için iletişim formundan “Kariyer” notuyla ulaşabilirsiniz.