Kto szuka:
Power Media
Stanowisko:
SRE/DevOps Engineer
Lokalizacja:
Kraków
małopolskie
Opis stanowiska podany przez pracodawcę:
Firma technologiczna, z główną siedzibą w USA (New York), rozwijającą zaawansowaną platformę AI dla branży medycznej, wspierającą optymalizację procesów w szpitalach i placówkach opieki zdrowotnej. Pomagają zmniejszać koszty operacyjne, eliminować nieefektywności i poprawiać doświadczenia pacjentów. Ich platforma wykorzystuje sztuczną inteligencję (AI), analizę danych w czasie rzeczywistym (RTLS, EHR) oraz automatyzację do zarządzania personelem, sprzętem i przestrzenią medyczną.
Stanowisko: Site Reliability Engineer.
Model pracy: hybrydowy lub w pełni zdalny.
Zakres obowiązków
- Projektowanie i utrzymanie wysoce dostępnej, odpornej na awarie i skalowalnej infrastruktury chmurowej (AWS).
- Wdrażanie i monitorowanie SLOs, SLIs oraz SLAs w celu śledzenia niezawodności systemu i optymalizacji jego dostępności.
- Nadzór nad wdrożeniami platformy produkcyjnej.
- Monitorowanie opóźnień, ruchu, błędów i kondycji systemu przy użyciu nowoczesnych narzędzi do obserwowalności.
- Przeprowadzanie analiz przyczyn źródłowych (RCA) i post-mortem, aby stale zwiększać odporność systemu.
- Automatyzacja zarządzania infrastrukturą za pomocą Terraform, Ansible lub Pulumi.
- Wdrażanie CI/CD pipelines, zapewniając płynne i bezpieczne wdrożenia.
- Tworzenie mechanizmów samonaprawczych przy użyciu operatorów Kubernetes, auto-skalowania i detekcji awarii.
- Zapewnienie zgodności z regulacjami HIPAA, GDPR oraz innymi przepisami dotyczącymi ochrony danych w sektorze zdrowia.
- Definiowanie i realizacja planów awaryjnych (Disaster Recovery – DR) oraz strategii ciągłości działania.
- Zarządzanie i optymalizacja środowisk AWS pod kątem wydajności i kosztów.
- Wdrażanie i utrzymanie narzędzi do obserwowalności, budowanie frameworków alertowania i reakcji w czasie rzeczywistym.
- Tworzenie i wdrażanie najlepszych praktyk w zakresie logowania, debugowania i monitorowania wydajności.
- Udział w całodobowych dyżurach on-call (24/7) - średnio 1 x w miesiącu
Firma oferuje
- Stałą współpracę na podstawie umowy o pracę lub B2B,
- Możliwość udziału w akcjach firmy,
- Pracę nad innowacyjną platformą AI dla sektora healthcare,
- Możliwość pracy przy projektach mających wpływ na przyszłość technologii medycznej
- Pracę w międzynarodowym środowisku (współpraca z zespołem z USA),
- Możliwość w pełni zdalnej lub hybrydowej (biuro w Krakowie),
- Pracę w zespole ekspertów AI, DevOps i Data Science,
- Elastyczny czas pracy i duża autonomia w działaniu,
- Realny wpływ na rozwój platformy, która poprawia jakość opieki zdrowotnej,
- Benefity: prywatna opieka medyczna i system kafeteryjny.
Wymagania stawiane pracownikowi:
Wymagania
- Minimum 4 lata doświadczenia w roli Site Reliability Engineer
- Bardzo dobra znajomość Kubernetes, Docker i AWS,
- Doświadczenie w automatyzacji infrastruktury z użyciem Terraform, Ansible lub Pulumi,
- Umiejętność analizy i optymalizacji systemów pod kątem wydajności i kosztów,
- Znajomość systemów monitoringu i logowania (Prometheus, Grafana, ELK, OpenTelemetry),
- Dobra znajomość języka Python, Golang lub Bash w zakresie automatyzacji,
- Doświadczenie w pracy z systemami przetwarzania danych w czasie rzeczywistym (Kafka, streaming),
- Znajomość najlepszych praktyk w zakresie cyberbezpieczeństwa, zarządzania siecią i load balancingu,
- Bardzo dobra znajomość j. angielskiego (min. B2) – codzienna praca w międzynarodowym zespole,
- Mile widziane: doświadczenie w branży medycznej i znajomość regulacji (HIPAA, GDPR).
Kontakt do pracodawcy:
Kliknij tutaj, aby skontaktować się z pracodawcą lub wysłać swoje CV »
© Kasat Sp. z o.o.