I en nylig podcast gav Google et dybdegående indblik i deres interne beslutningsproces for offentliggørelse af hændelser, der påvirker søgning, crawling og indeksering. Denne gennemsigtighed er afgørende for forståelsen af, hvordan virksomheden håndterer problemer, som kan påvirke søgemaskineoptimering (SEO) og i sidste ende brugeroplevelsen.
Baggrund
Googles søgemaskine er kendt for sin *eksemplariske oppetid*, med et “ekstremt” højt oppetidsnummer, der sjældent falder under 99.999%. De fleste rapporterede problemer tilskrives netværksroutingproblemer snarere end interne fejl. Dog er backend-systemerne, der er involveret i crawling og indeksering, ikke immune over for hændelser, som kan have alvorlige konsekvenser for tidssensitivt indhold som nyheder og salgsevents.
Rollen af Site Reliability Engineering (SRE)
Inden for Google er et specialiseret team kaldet Site Reliability Engineering (SRE) ansvarlig for at sikre den *glatte drift* af offentligt tilgængelige tjenester. De håndterer hændelser ved hjælp af automatiserede processer til at overvåge og reagere på potentielle problemer. Disse processer er designet til at identificere og differentiere mellem reelle problemer og falske positive.
Intern Hændelseshåndtering
For punkter, der kræver opmærksomhed, prioriterer SRE-teamet baseret på omfanget af brugerens indflydelse. Mindre hændelser håndteres ofte automatisk uden offentlige meddelelser, da de typisk ikke væsentligt hæmmer brugeraktiviteten. Hvis en hændelse vurderes at have en betydelig brugerindflydelse, hæves prioriteten, og en yderligere evaluering udføres for at bestemme nødvendigheden og tidspunktet for en offentliggørelse.
Kriterier for Offentliggørelse
Gary Illyes forklarede i Google-podcasten, at offentlige meddelelser foretages, når hændelser har *væsentlig brugerindflydelse*, såsom … (Note: The text cut off here, original content ends.)