İçeriğe geç

Rol

Mono’nun yönettiği Linux, Kubernetes ve bulut platformlarında güvenilirlik, izleme ve olay müdahalesi süreçlerini tasarlayacak bir Site Reliability Engineer arıyoruz.

Sorumluluklar

  • Linux ve Kubernetes üretim ortamlarının operasyonu.
  • SLO, alerting, runbook ve incident response süreçlerinin tasarımı.
  • Grafana, Prometheus/VictoriaMetrics, Loki ve OpenTelemetry tabanlı gözlemlenebilirlik.
  • Ansible / OpenTofu ile otomasyon.
  • Müşteri ekipleriyle teknik kök neden analizi ve iyileştirme planı.

Aranan nitelikler

  • Linux üzerinde güçlü troubleshooting deneyimi.
  • Kubernetes networking, ingress, storage ve deployment pratikleri.
  • En az bir gözlemlenebilirlik yığınıyla üretim tecrübesi.
  • Yazılı iletişim ve dokümantasyon alışkanlığı.
  • On-call kültürü ve blameless postmortem yaklaşımına açıklık.

Artı değer

  • PostgreSQL / Redis / Kafka operasyon deneyimi.
  • Cilium, Istio, Linkerd veya benzeri ağ/policy araçları.
  • Cloudflare Workers / Pages veya edge platform tecrübesi.

Başvurmak için iletişim formundan “Kariyer” notuyla ulaşabilirsiniz.