Kontentke ótiw

Sayt isenimliligin támiyinlew injeneriyası

Wikipedia — erkin enciklopediya

Sayt isenimliligin támiyinlew injeneriyası (SRE) – bul programmalıq támiynat injeneriyası hám IT infrastrukturasın qollap-quwatlaw tarawındaǵı pán bolıp, ol ornatılǵan programmalıq támiynat sistemaları hám úlken programmalıq xızmetlerdiń (jańa programmalıq támiynattı ornatıw, apparatlıq támiynat buzılıwları hám kiberqáwipsizlik hújimleri sıyaqlı waqıyalar dawamında isenimli juwap beriw waqtın támiyinlewi kútilgen) qoljetimliligi hám ónimdarlıǵın baqlaydı hám jaqsılaydı.[1] Ádette avtomatlastırıwǵa hám kod sıpatındaǵı infrastruktura metodologiyasına dıqqat qaratıladı. SRE isenimlilikke járdem beriw ushın programmalıq támiynat injeneriyası, IT infrastrukturası, veb-islep shıǵıw hám operaciyalar elementlerinen paydalanadı.[2] Ol DevOps qa uqsas, sebebi ekewi de ornatılǵan programmalıq támiynat sistemalarınıń isenimliligi hám qoljetimliligin jaqsılawdı maqset etedi.

Tariyxı

Sayt isenimliligin támiyinlew injeneriyası Google da Benjamin Treynor Sloss tárepinen payda bolǵan,[3][4] ol 2003-jılı SRE komandasın dúzgen.[5] Bul túsinik programmalıq támiynattı islep shıǵıw tarawında keńeyip, hár qıylı kompaniyalardı sayt isenimliligin támiyinlew injenerlerin jumısqa alıwǵa alıp keldi.[6] 2016-jıl mart ayına shekem Google da 1000 nan aslam sayt isenimliligin támiyinlew injeneri jumıs islegen.[7] Arnawlı SRE komandaları iri veb-islep shıǵıw kompaniyalarında keń tarqalǵan. Orta hám kishi kompaniyalarda geyde DevOps komandaları SRE nı da orınlaydı. Bul koncepciyanı qabıl etken shólkemler qatarına Airbnb, Dropbox, IBM,[8] LinkedIn,[9] Netflix hám Wikimedia kiredi.[10]

Anıqlama

Sayt isenimliligin támiyinlew injenerleri (SRE ler) sistemanıń ashıqlıǵı, keshigiw waqtı, ónimdarlıǵı, nátiyjeliligi, ózgerislerdi basqarıw, baqlaw, apatlı jaǵdaylarǵa juwap beriw hám quwattı jobalastırıw kombinaciyası ushın juwapker. SRE ler kóbinese programmalıq támiynat injeneriyası, sistemalar injeneriyası hám/yamasa sistema administraciyası tarawlarında tájiriybege iye.[11] SRE diń baslı baǵdarları avtomatlastırıw, sistema dizaynı hám sistemanıń turaqlılıǵın jaqsılawdı óz ishine aladı.

SRE DevOps tıń anıq bir ámelge asırılıwı dep esaplanadı;[12] ol ásirese isenimli sistemalar qurıwǵa baǵdarlanǵan, al DevOps operaciyalardıń keńirek kólemin qamtıydı.[13][14] Hár qıylı baǵdarlarǵa iye bolıwına qaramastan, geypara kompaniyalar óz operaciyalıq komandaların SRE komandaları dep qayta ataǵan.

Principler hám ámeliyatlar

Principlerdiń ulıwma anıqlamaları tómendegilerdi óz ishine aladı (biraq olar menen sheklenbeydi):

  • Shıǵın nátiyjeliligi ushın qaytalanatuǵın tapsırmalardı avtomatlastırıw.
  • Sheksiz háreketlerdiń aldın alıw ushın isenimlilik maqsetlerin anıqlaw.
  • Qoljetimlilik, keshigiw hám nátiyjelilikke qáwip-qáterlerdi azaytıw maqsetinde sistemalardı dizaynlaw.
  • Baqlaw imkaniyatı - aldın ala ne soraw kerek ekenligin bilmey turıp, sistema haqqında qálegen sorawlardı beriw múmkinshiligi.[15]

Ámeliyatlardıń ulıwma anıqlamaları tómendegilerdi óz ishine aladı (biraq bular menen sheklenbeydi):[16]

  • Awır miynetti basqarıw, joqarıda kórsetilgen birinshi principti ámelge asırıw.
  • Isenimlilik maqsetlerin anıqlaw hám ólshew - SLI, SLO hám qáte byudjetleri.
  • Isenimlilikke baǵdarlanǵan Abstrakt emes úlken kólemli sistemalardı jobalastırıw (NALSD).
  • Baqlaw múmkinshiligin jobalastırıw hám ámelge asırıw.
  • Hádiyse basqarıw processin anıqlaw, sınaw hám júrgiziw.
  • Quwatlılıqtı jobalastırıw.
  • CI/CD qosqanda, ózgeris hám reliz basqarıwı.
  • Xaos injenerligi.

Ornalastırıw

SRE toparları shólkemler ishindegi basqa bólimler menen birge islesip, joqarıda aytılǵan principlerdi ámelge asırıwǵa jol kórsetedi. Tómende ulıwma ámeliyatlardıń ulıwma kórinisi berilgen:[17]

Kitchen Sink

Kitchen Sink SRE komandalarınıń qadaǵalaytuǵın xızmetler hám jumıs processleriniń keń hám kóbinese shegarasız kólemin ańlatadı. Anıq belgilengen shegaraları bar dástúrli rollerden ayırmashılıǵı, SRE lar sistema ónimdarlıǵın optimallastırıw, incidentlerdi basqarıw hám avtomatlastırıw sıyaqlı hár qıylı juwapkershilikler menen tapsırılǵan. Bul usıl SRE larǵa kóp sanlı qıyınshılıqlardı sheshiwge múmkinshilik beredi, sistemalardıń ónimli islewin hám ózgeriwshi talaplar hám quramalılıqlarǵa juwap retinde rawajlanıwın támiyinleydi.

Infrastruktura

Infrastruktura SRE komandaları basqa komandalardıń jumıs processlerin qollap-quwatlaytuǵın sistemalardıń isenimliligin saqlaw hám jaqsılawǵa dıqqat qaratadı. Olar geyde platforma injenerlik komandaları menen birge islese de, olardıń tiykarǵı juwapkershiligi jumıs waqtı, ónimdarlıq hám ónimlilikti támiyinlew bolıp tabıladı. Ekinshi tárepten, platforma komandaları tiykarınan shólkem boyınsha qollanılatuǵın programmalıq támiynat hám sistemalardı islep shıǵadı. Isenimlilik ekewi ushın da maqset bolsa da, platforma komandaları ishki mápli tárepler tárepinen qollanılatuǵın qurallar hám xızmetlerdi jaratıw hám saqlawdı birinshi orınǵa qoyadı, al Infrastruktura SRE komandaları sol sistemalardıń nemquraylı islewin hám isenimlilik standartlarına juwap beriwin támiyinlew menen tapsırılǵan.

Qurallar

SRE komandaları sistema isenimliligin ólshew, saqlaw hám jaqsılaw maqsetinde hár qıylı qurallardı paydalanadı. Bul qurallar ónimdarlıqtı baqlawda, máselelerdi anıqlawda hám aldın ala texnikalıq xızmet kórsetiwdi jeńillestiriwde rol oynaydı. Mısalı, Nagios Core kóbinese sistemanı baqlaw hám eskertiw ushın qollanıladı, al Prometheus (programmalıq támiynat) bultqa-tiykarlanǵan ortalıqlarda metrikalardı jıynaw hám soraw ushın jiyi paydalanıladı.

Ónim yamasa Qosımsha

Belgili ónimler yamasa qosımshalarǵa arnalǵan SRE komandaları úlken shólkemlerde keń tarqalǵan.[18] Bul komandalar tiykarǵı xızmetlerdiń isenimliligi, masshtablanıwshılıǵı hám ónimdarlıǵın támiyinlew ushın juwapker. Úlkenirek kompaniyalarda hár biri hár túrli ónimler yamasa qosımshalarǵa dıqqat qaratıwshı birneshe SRE komandalarınıń bolıwı ádettegi jaǵday bolıp, bul hár bir tarawdıń ónimdarlıq hám qoljetimlilik maqsetlerine erisiw ushın arnawlı dıqqat qaratıwın támiyinleydi.

Ornatılǵan

Ornatılǵan modelde jeke SRE ler yamasa kishi SRE juplıqları programmalıq támiynat injenerlik komandalarına integraciyalanǵan. Bul SRE ler baǵdarlamashılar menen birge islep, avtomatlastırıw, baqlaw hám incidentlerge juwap beriw sıyaqlı tiykarǵı SRE principlerin programmalıq támiynattı islep shıǵıw cikline tuwrıdan-tuwrı qollanadı. Bul usıl isenimlilikti, ónimdarlıqtı hám SRE ler menen baǵdarlamashılar arasındaǵı birge islesiwdi jaqsılawdı maqset etedi.

Konsalting

Konsalting SRE komandaları shólkemlerge SRE principleri hám tájiriybelerin ámelge asırıw boyınsha keńes beriwge qánigelesken. Ádette hár qıylı ámelge asırıwlar boyınsha tariyxqa iye tájiriybeli SRE lerdan quralǵan bul komandalar belgili shólkemlik zárúrlikler ushın túsinikler hám jetekshilik beredi. Klientler menen tuwrıdan-tuwrı islegende, bul SRE ler kóbinese 'Klient Isenimliligi Injenerleri' dep ataladı.

SRE ni qabıl etken úlken shólkemlerde gibrid model keń tarqalǵan. Bul model hár túrli ónimlerdiń belgili isenimlilik zárúrliklerin sheshiwge arnalǵan birneshe Ónim/Qollaw SRE komandaları sıyaqlı hár túrli ámelge asırıwlardı óz ishine aladı. Infrastruktura SRE komandası barlıq ónimler hám qollawlardı qollap-quwatlaytuǵın birlesken platforma ushın ulıwma isenimlilik maqsetlerine erisiw ushın Platforma injenerlik toparı menen birge islewi múmkin.

Sanaat

2014-jıldan baslap USENIX shólkemi hár túrli tarawlardan sayt isenimliligi injenerlerin biriktiretuǵın hár jılǵı SREcon konferenciyasın ótkeredi. Bul konferenciya professionallar ushın bilimlerdi bólisiw, ónimli tájiriybelerdi izertlew hám sayt isenimliligi injeneriyasındaǵı trendlerdi talqılaw ushın platforma bolıp tabıladı.[19]

Derekler

  1. «What is SRE? - Site Reliability Engineering Explained - AWS» (en-US). Amazon Web Services, Inc.. Qaraldı: 26-dekabr 2024-jıl.
  2. «Evaluating where your team lies on the SRE spectrum» (en). Google Cloud Blog. Qaraldı: 26-iyun 2021-jıl.
  3. Hill. «Love DevOps? Wait until you meet SRE» (en). Atlassian. Qaraldı: 17-iyun 2021-jıl.
  4. «What is SRE?» (en). Red Hat. Qaraldı: 17-iyun 2021-jıl.
  5. Treynor. «Keys to SRE». USENIX SREcon14 (2014). Qaraldı: 17-iyun 2021-jıl.
  6. Gossett. «What Is a Site Reliability Engineer? What Does an SRE Do?» (en). Built In (1-iyun 2020-jıl). Qaraldı: 17-iyun 2021-jıl.
  7. Fischer. «Are site reliability engineers the next data scientists?» (en-US). TechCrunch (2-mart 2016-jıl). Qaraldı: 17-iyun 2021-jıl.
  8. «Site Reliability Engineering» (en). IBM Cloud Education. IBM (12-noyabr 2020-jıl). Qaraldı: 21-iyun 2021-jıl.
  9. «Site Reliability Engineering (SRE)». engineering.linkedin.com. Qaraldı: 12-mart 2024-jıl.
  10. «SRE - Wikitech» (en). wikitech.wikimedia.org. Qaraldı: 17-oktyabr 2021-jıl.
  11. Jones, Chris; Underwood, Todd; Nukala, Shylaja (June 2015). „Hiring Site Reliability Engineers“ (PDF). ;login:. 40-tom. 35–39-bet. Qaraldı: June 17, 2021.
  12. Dave Harrison. «Interview with Betsy Beyer, Stephen Thorne of Google» (9-oktyabr 2018-jıl). Qaraldı: 24-iyul 2024-jıl.
  13. What's the Difference Between DevOps and SRE? (class SRE implements DevOps). Google.
  14. «What is SRE? - SRE Explained - AWS» (en-US). Amazon Web Services, Inc.. Qaraldı: 5-noyabr 2022-jıl.
  15. «Learn about observability | Honeycomb» (en). docs.honeycomb.io. Qaraldı: 26-iyun 2021-jıl.
  16. «The 7 SRE Principles [And How to Put Them Into Practice»] (en). www.blameless.com. Qaraldı: 26-iyun 2021-jıl.
  17. «SRE at Google: How to structure your SRE team» (en). Google Cloud Blog. Qaraldı: 26-iyun 2021-jıl.
  18. «SRE at Google: How to structure your SRE team» (en-US). Google Cloud Blog. Qaraldı: 11-noyabr 2024-jıl.
  19. «Usenix SREcon». USENIX (2021). Qaraldı: 17-iyun 2021-jıl.