Site Reliability Engineer (SRE)
Jakarta Selatan
Full-time
Diposting pada 16/05/2025
Deskripsi Pekerjaan
- Menganalisis persyaratan Bisnis/Produk dan mengusulkan solusi teknis yang efektif dan efisien dalam memberikan perubahan dan inovasi pada infrastruktur dan lanskap Exchange
- Bekerja dengan kelompok fokus proyek (rekayasa produk, manajemen produk, arsitektur, dan CTO) untuk menyusun struktur perincian tugas untuk hasil yang diberikan dan memberikan perkiraan yang realistis untuk penyelesaian atau penugasan proyek.
- Merancang, membangun, memelihara, dan meningkatkan infrastruktur Exchange serta perkakas yang sesuai. Memastikan elastisitas infrastruktur dan skalabilitas otomatis untuk efisiensi biaya dalam pemanfaatan sumber daya sambil memastikan ketersediaan sistem yang tinggi dan toleransi kesalahan
- Berkolaborasi dengan Pengembang, SRE, dan Insinyur QA lainnya untuk melaksanakan pengujian integrasi, fungsional, dan regresi siklus penuh. Memiliki dan menyelesaikan semua cacat prioritas yang diidentifikasi dalam basis kode solusi secara efisien dan tepat waktu
- Mempromosikan perubahan perangkat lunak di semua lingkungan, dengan aman dan bertanggung jawab, melalui lingkungan Pengembangan, Pementasan untuk menerapkan pembaruan ke lingkungan Produksi dengan cara tanpa waktu henti.
- Menyediakan dukungan teknis Level 1 infrastruktur yang efektif selama jam kerja dan, terkadang, di luar jam kerja tergantung pada jadwal rotasi. Merancang, membangun, memelihara, dan meningkatkan alat pemantauan infrastruktur masing-masing yang sangat penting untuk:
- Momentum situasional seperti kewaspadaan dan respons insiden proaktif
- Kegiatan perencanaan kapasitas infrastruktur di masa depan
- Berpartisipasi dalam latihan tim untuk mengidentifikasi dan mengimplementasikan area untuk peningkatan berkelanjutan, dan bersikaplah proaktif dalam menyampaikan ide-ide Anda
- Mendidik dan membimbing kolega teknisi Anda di bidang keahlian dan pengetahuan domain Anda sendiri, dan berpikiran terbuka serta mudah didekati
Persyaratan
- 5+ tahun pengalaman SRE, idealnya bekerja dengan salah satu vendor cloud besar: Amazon Web Services, Google Cloud, MS. Azure, dll.
- Pengalaman dalam merancang dan mengimplementasikan pengaturan AWS dan/atau GCP dari awal
- Pengalaman dalam merancang, membangun, menerapkan, dan mengoperasikan solusi kontainer siap pakai di Kubernetes
- Pengalaman yang solid dalam menyiapkan dan memelihara infrastruktur broker pesan (Kafka, RocketMQ, dll.)
- Pengalaman dalam menyiapkan lapisan Cloud Persistence (AWS Aurora, GCP BigQuery, dll.) )
- Pengalaman mengimplementasikan Service mesh besar melalui Istio atau solusi lain yang relevan
- Pengalaman membangun lingkungan sesuai permintaan dan berumur pendek (untuk skenario debugging, profiling, dan load-testing)
- Pengalaman dengan sistem operasi, terutama pengetahuan yang baik tentang sistem operasi Linux dan pemahaman tentang arsitektur jaringan