Rol

Mono’nun yönettiği Linux, Kubernetes ve bulut platformlarında güvenilirlik, izleme ve olay müdahalesi süreçlerini tasarlayacak bir Site Reliability Engineer arıyoruz.

Sorumluluklar

Linux ve Kubernetes üretim ortamlarının operasyonu.
SLO, alerting, runbook ve incident response süreçlerinin tasarımı.
Grafana, Prometheus/VictoriaMetrics, Loki ve OpenTelemetry tabanlı gözlemlenebilirlik.
Ansible / OpenTofu ile otomasyon.
Müşteri ekipleriyle teknik kök neden analizi ve iyileştirme planı.

Aranan nitelikler

Linux üzerinde güçlü troubleshooting deneyimi.
Kubernetes networking, ingress, storage ve deployment pratikleri.
En az bir gözlemlenebilirlik yığınıyla üretim tecrübesi.
Yazılı iletişim ve dokümantasyon alışkanlığı.
On-call kültürü ve blameless postmortem yaklaşımına açıklık.

Artı değer

PostgreSQL / Redis / Kafka operasyon deneyimi.
Cilium, Istio, Linkerd veya benzeri ağ/policy araçları.
Cloudflare Workers / Pages veya edge platform tecrübesi.

Başvurmak için iletişim formundan “Kariyer” notuyla ulaşabilirsiniz.