Power Media

Stanowisko:

SRE/DevOps Engineer

Lokalizacja:

Kraków

małopolskie

Opis stanowiska podany przez pracodawcę:

Firma technologiczna, z główną siedzibą w USA (New York), rozwijającą zaawansowaną platformę AI dla branży medycznej, wspierającą optymalizację procesów w szpitalach i placówkach opieki zdrowotnej. Pomagają zmniejszać koszty operacyjne, eliminować nieefektywności i poprawiać doświadczenia pacjentów. Ich platforma wykorzystuje sztuczną inteligencję (AI), analizę danych w czasie rzeczywistym (RTLS, EHR) oraz automatyzację do zarządzania personelem, sprzętem i przestrzenią medyczną.

Stanowisko: Site Reliability Engineer.

Model pracy: hybrydowy lub w pełni zdalny.

Zakres obowiązków

Projektowanie i utrzymanie wysoce dostępnej, odpornej na awarie i skalowalnej infrastruktury chmurowej (AWS).
Wdrażanie i monitorowanie SLOs, SLIs oraz SLAs w celu śledzenia niezawodności systemu i optymalizacji jego dostępności.
Nadzór nad wdrożeniami platformy produkcyjnej.
Monitorowanie opóźnień, ruchu, błędów i kondycji systemu przy użyciu nowoczesnych narzędzi do obserwowalności.
Przeprowadzanie analiz przyczyn źródłowych (RCA) i post-mortem, aby stale zwiększać odporność systemu.
Automatyzacja zarządzania infrastrukturą za pomocą Terraform, Ansible lub Pulumi.
Wdrażanie CI/CD pipelines, zapewniając płynne i bezpieczne wdrożenia.
Tworzenie mechanizmów samonaprawczych przy użyciu operatorów Kubernetes, auto-skalowania i detekcji awarii.
Zapewnienie zgodności z regulacjami HIPAA, GDPR oraz innymi przepisami dotyczącymi ochrony danych w sektorze zdrowia.
Definiowanie i realizacja planów awaryjnych (Disaster Recovery – DR) oraz strategii ciągłości działania.
Zarządzanie i optymalizacja środowisk AWS pod kątem wydajności i kosztów.
Wdrażanie i utrzymanie narzędzi do obserwowalności, budowanie frameworków alertowania i reakcji w czasie rzeczywistym.
Tworzenie i wdrażanie najlepszych praktyk w zakresie logowania, debugowania i monitorowania wydajności.
Udział w całodobowych dyżurach on-call (24/7) - średnio 1 x w miesiącu

Firma oferuje

Stałą współpracę na podstawie umowy o pracę lub B2B,
Możliwość udziału w akcjach firmy,
Pracę nad innowacyjną platformą AI dla sektora healthcare,
Możliwość pracy przy projektach mających wpływ na przyszłość technologii medycznej
Pracę w międzynarodowym środowisku (współpraca z zespołem z USA),
Możliwość w pełni zdalnej lub hybrydowej (biuro w Krakowie),
Pracę w zespole ekspertów AI, DevOps i Data Science,
Elastyczny czas pracy i duża autonomia w działaniu,
Realny wpływ na rozwój platformy, która poprawia jakość opieki zdrowotnej,
Benefity: prywatna opieka medyczna i system kafeteryjny.

Wymagania stawiane pracownikowi:

Wymagania

Minimum 4 lata doświadczenia w roli Site Reliability Engineer
Bardzo dobra znajomość Kubernetes, Docker i AWS,
Doświadczenie w automatyzacji infrastruktury z użyciem Terraform, Ansible lub Pulumi,
Umiejętność analizy i optymalizacji systemów pod kątem wydajności i kosztów,
Znajomość systemów monitoringu i logowania (Prometheus, Grafana, ELK, OpenTelemetry),
Dobra znajomość języka Python, Golang lub Bash w zakresie automatyzacji,
Doświadczenie w pracy z systemami przetwarzania danych w czasie rzeczywistym (Kafka, streaming),
Znajomość najlepszych praktyk w zakresie cyberbezpieczeństwa, zarządzania siecią i load balancingu,
Bardzo dobra znajomość j. angielskiego (min. B2) – codzienna praca w międzynarodowym zespole,
Mile widziane: doświadczenie w branży medycznej i znajomość regulacji (HIPAA, GDPR).

Kontakt do pracodawcy:

Kliknij tutaj, aby skontaktować się z pracodawcą lub wysłać swoje CV »

Aplikuj na tą ofertę pracy

Oferta pochodzi z serwisu