Визначивши SLO, ви повинні слідкувати за тим, щоб вони дотримувалися. Рідше такий спеціаліст відповідає ще й за відповідність інфраструктури вимогам, таким як GDPR та SOC2. Активний інтерес до цієї позиції з’явився у 2016 році, коли Google розповіла, кого в компанії називають Site Reliability Engineer. За їхніми словами, на цій позиції фахівці постійно стикаються із питаннями навколишніх про те, чим вони займаються.
Що таке Site Reliability Engineering?
- Насамкінець, у щорічних звітах LinkedIn за 2017, 2018 та 2019 роки SRE завжди потрапляв у топ 20 «Найперспективніших робочих місць».
- Однак SRE тісно співпрацює з DevOps для створення надійної інфраструктури.
- Набагато важливіше ваше прагнення вирішувати нові виклики, зацікавленість у роботі та покращення навичок.
Аналізуючи системні журнали та звіти про інциденти, SRE може надати детальну інформацію про першопричину дефектів, що дозволить команді QA більш ефективно їх усувати. Зрештою, вибір відповідних метрик допомагає узгодити і направити ваші дії у разі, якщо щось піде не так, а також дає впевненість команді SRE у «здоров’ї» сервісу. В ролі SRE важливо вміти аналізувати і вдосконалювати код, але також розуміти, як працюють сервери, як система масштабується та відбувається розподіл навантаження. Приблизно половина робочого часу фахівця витрачається на розробку та автоматизації. Згідно з дослідженням зарплат DOU за зиму 2024 року, середня заробітна плата SRE складала $4 500 (у DevOps — $3 500).
Как стать SRE и куда двигаться дальше
Тож якщо ви шукаєте нових можливостей для розвитку і відчуваєте у собі жагу до опанування SRE, зараз саме час закладати фундамент для майбутнього. Тим паче, що в перспективі SRE може вирости до Head of Engineering чи CTO. Вона входить до рейтингу Linkedin Jobs on the Rise, а за даними Gartner, до 2027 року 75% компаній використовуватимуть практики SRE у своїх організаціях для оптимізації операцій. На відміну від сисадміна, SRE не просто обслуговує інфраструктуру, а активно працює над її вдосконаленням —— рефакторингом, автоматизацією рутинних задач, покращенням масштабованості та відмовостійкості. У статті я хочу розвінчати головні міфи щодо зони відповідальності SRE, поділитися важливими навичками, необхідними для SRE-фахівців, та розповісти про власний шлях переходу на цю роль.
Тестування у SRE: чи є куди розвиватись
З Docker ви можете автоматизувати процес розгортання та управління програмами в контейнеризованих середовищах. Деякі країни на різних континентах уже висловлювали своє бажання стати посередниками для того, щоб якнайшвидше завершити протистояння. Можна розвивати експертизу в безпеці чи, наприклад, у machine learning. Так, це вже не просто архітектура, це також і менеджмент, але це не означає, що шляхи можуть зливатися.
SRE — противоположность фича-девелопменту?
- Впровадження SRE (Site Reliability Engineering) приведе до значної трансформації ІТ-організацій, змінивши майже кожну роль.
- «По суті, це те, що відбувається, коли ви просите інженера розробити операційну функцію …
- Під літерою «R» зазвичай розуміють надійність («Reliability»), але вона може бути інтерпретована і як стабільність чи стійкість («Resilience»).
- Враховуючи свої знання та скіли, ти можеш обрати ті, що доповнять твою базу знань.
- Ці навички дозволять ефективно виконувати обов’язки SRE та забезпечити стабільність та надійність інфраструктури.
Наприклад, допомагає в налаштуванні систем моніторингу та алертингу. SRE (Site Reliability Engineer) займається питаннями стабільності, відмовостійкості та розширення системи, а також аналізом інцидентів. Насамкінець, у щорічних звітах LinkedIn за 2017, 2018 та 2019 роки SRE завжди потрапляв у топ 20 «Найперспективніших робочих місць».
Літера «S» наразі може мати значення як «site», так і тлумачення «system», «service», «software» і навіть означати «online Stuff» у найширшому розумінні цього слова. Під літерою «R» зазвичай розуміють надійність («Reliability»), але вона може бути інтерпретована і як стабільність чи стійкість («Resilience»). Нарешті за «E» стоять люди («Engineers») чи практика загалом («Engineering»). Впровадження SRE в компанії може змінити підхід до роботи та надання цифрових послуг. Воно починається з оцінки наявної інфрастуктури, процедур і можливостей команди.
Особенности направления
Впровадження SRE (Site Reliability Engineering) приведе до значної трансформації ІТ-організацій, змінивши майже кожну роль. Однак існує загальне уявлення, що SRE замінює інженерів забезпечення якості (QA). Це призводить до того, що команди QA ставляться з опором до впровадження SRE, оскільки вони вважають, що їхня роль стане застарілою.
Як SRE пов’язане із тестуванням?
Site Reliability Engineering — це, перш за все, розбудова світу онлайн-сервісів — від інфраструктурних (IaaS) і мережевих (NaaS) проектів до програмного забезпечення (SaaS) і платформ (PaaS). Це значна дисципліна, яка вимагає навичок трудові відносини для роботи з великими, розподіленими сайтами. Вона усуває здогадки і суперечки про те, що і коли можна запускати. 36% SRE-фахівців мають їх (найчастіше щомісячні чи за гарні показники роботи), а серед DevOps — тільки 20%.