Feb, 28, 2026
SRE: цельная модель надежности от базовых принципов до SLO-алертинга
Единый материал по SRE: термины SLI/SLO/SLA, перцентили, error budget, on-call/incident-процессы, PRR/DR и production-подход к Prometheus/Grafana-алертингу.
Feb, 21, 2026
Network Observability: Prometheus, OpenTelemetry, Hubble
Как строить наблюдаемость сети и сервисного трафика: метрики, потоки, трассировка и практические сигналы деградации.