Observability Implementation

Folder: .github/skills/tsh-implementing-observability/ Used by: DevOps Engineer

Provides patterns for logging, monitoring, alerting, and distributed tracing across services.

Three Pillars

Pillar	Purpose	Tools
Metrics	Quantitative system health measurement	Prometheus, CloudWatch, Datadog
Logs	Structured event records for debugging	ELK Stack, CloudWatch Logs, Loki
Traces	Request flow across service boundaries	Jaeger, Zipkin, AWS X-Ray, OpenTelemetry

Severity	Response Time	Example
Critical	Immediate (page)	Service down, data loss risk
Warning	Within hours	Disk >80%, elevated error rate
Info	Next business day	Deployment completed, scaling event