Geekfactor Geekfactor

SRE Engineer

Надежность, SLO, инциденты, наблюдаемость и инженерные практики.

Уровни и матрица компетенций

Middle

Middle SRE Engineer

SLO, инциденты, наблюдаемость, устранение причин отказов.

Задачи и ответственность

- Вести инциденты
- Внедрять SLO
- Улучшать наблюдаемость
- Делать postmortem

Требования

- Observability stack
- Linux
- Kubernetes basics
- Понимание reliability

Темы для интервью

- SLI/SLO
- Alert fatigue
- Postmortem
- Error budgets

Проекты в портфолио

- SLO setup
- Dashboards
- Incident playbooks

Рост и следующие шаги

Senior SRE / Platform.