Cloudflare otkrio šta je srušilo pola interneta: Jedna jedina datoteka izazvala globalni haos
Sumirano
- Internet doživeo veliki tehnički kolaps zbog prevelike konfiguracione datoteke.
- Cloudflare potvrdio da problem nije bio rezultat hakerskog napada ili sabotaže.
- Greška u internim dozvolama dovela do generisanja loše konfiguracione datoteke.
- Incident izazvao masovno generisanje 5xx grešaka i pad mnogih sajtova.
- Cloudflare najavio nova pravila za sprečavanje sličnih incidenata u budućnosti.
Internet je juče doživeo jedan od najvećih tehničkih kolapsa u poslednjih nekoliko godina, a krivac nije bio hakerski napad, sabotaža ili preopterećenje servera. Problem je nastao zbog jedne konfiguracione datoteke koja je postala prevelika i izazvala lančani pad čitavog sistema. Cloudflare je objavio zvanično objašnjenje incidenta i potvrdio da je sve krenulo iznutra.
Iako su korisnici širom sveta dobijali poruke o grešci i sumnjali na masovan DDoS napad, Cloudflare je naglasio da nije bilo nikakve zlonamerne aktivnosti. Pad je zahvatio ogroman broj sajtova i aplikacija, a oporavak je trajao satima dok se sistem nije vratio u normalu.
Sve je počelo sa pogrešnom konfiguracijom
Do prekida je došlo kada je greška u internim dozvolama unutar baze podataka dovela do generisanja loše konfiguracione datoteke za sistem za upravljanje botovima. Ta datoteka trebalo je da razlikuje ljudski od automatizovanog saobraćaja, ali umesto toga je udvostručena, postala prevelika i srušila deo sistema za usmeravanje saobraćaja.
Zbog toga je došlo do masovnog generisanja takozvanih 5xx grešaka, što znači da serveri nisu mogli da obrade zahteve. Krah je bio toliko širok da su pali i sajtovi koji inače služe za proveru prekida, uključujući i one koje korisnici obično posete kada žele da saznaju zašto su servisi nedostupni.
Zašto je problem bio teško uočljiv
Konfiguraciona datoteka nije bila loša uvek, već periodično. Sistem ju je generisao na svakih nekoliko minuta i, u zavisnosti od toga koji čvor obrađuje upit, ponekad je bila ispravna, a ponekad neispravna.
Ove fluktuacije dodatno su otežale dijagnostiku i učinile da kvar izgleda nestabilno, što je produžilo vreme oporavka.
Cloudflare priznaje najteži pad još od 2019. godine
Nakon identifikacije problema, inženjeri Cloudflarea zaustavili su distribuciju loše datoteke i ručno ubacili prethodnu, ispravnu verziju. Kompanija najavljuje nova interna pravila koja treba da spreče slične incidente, uključujući strože kontrole konfiguracija i brže globalno isključivanje pojedinih funkcija kada nastane greška.
Osnivač Cloudflare-a Metju Prins izvinio se korisnicima i naveo da je ovo "najgori pad rada kompanije od 2019. godine", kao i da će projekti za povećanje otpornosti sistema biti prioritet u narednom periodu.
(Telegraf.rs)