Bài đăng

Nâng cấp Kubernetes Zero-Downtime | Nhật ký vận hành

Chuyện về devsecops
Nâng cấp Kubernetes Zero-Downtime | Nhật ký vận hành
Nhật ký vận hành: Nâng cấp cụm Kubernetes (EKS/GKE) Zero-Downtime lúc 3 giờ sáng Biến nỗi sợ hãi thành một quy trình có thể dự đoán được. Phần 1: Sự tĩnh lặng lúc 3 giờ sáng: Lời tự sự của một kỹ sư về sự hỗn loạn có kiểm soát Bối cảnh: 2:45 sáng. Ánh sáng duy nhất trong phòng phát ra từ màn hình hiển thị terminal của cụm production. Không khí đặc quánh một hỗn hợp quen thuộc của caffeine và sự căng thẳng. Đêm nay, chúng tôi sẽ nâng cấp trái tim của nền tảng: một cụm Kubernetes production, từ phiên bản 1.27 lên 1.28. Đây không chỉ là một cú "bump" phiên bản đơn thuần; đó là một nỗ lực kỹ thuật được dàn dựng công phu, nơi một sai sót nhỏ nhất cũng có thể leo thang thành một sự cố toàn diện. Giải quyết nỗi đau cốt lõi: Cần phải đối mặt trực diện với "nỗi sợ" khi nâng cấp Kubernetes. Nỗi sợ này hoàn toàn có cơ sở, được sinh ra từ những câu chuyện kinh hoàng về các lần nâng cấp thất bại, những thông báo lỗi khó hiểu, và các dịch vụ từ chối hoạt động trở lại. Cuốn nhật ký n…