GitHub gặp sự cố diện rộng, hàng loạt pipeline CI/CD toàn cầu bị đình trệ

WhiteHat Team

Administrators
Thành viên BQT
09/04/2020
141
1.930 bài viết
GitHub gặp sự cố diện rộng, hàng loạt pipeline CI/CD toàn cầu bị đình trệ
GitHub vừa trải qua một đợt gián đoạn diện rộng ảnh hưởng tới hệ sinh thái phát triển phần mềm toàn cầu, khiến nhiều quy trình CI/CD tự động bị tê liệt trong hơn một giờ đồng hồ.
anh minh hoa.png

Theo thông tin từ trang trạng thái chính thức của GitHub, sự cố bắt đầu vào khoảng 10:57 UTC ngày 26/5, ban đầu được ghi nhận dưới dạng hiện tượng “degraded performance” đối với hai dịch vụ quan trọng là GitHub Actions và GitHub Pages. Chỉ hơn 20 phút sau, nền tảng này xác nhận GitHub Actions rơi vào trạng thái “degraded availability”, ảnh hưởng tới phần lớn workflow đang vận hành.

Đến 11:53 UTC, GitHub xác định nguyên nhân xuất phát từ lỗi xác thực, khiến các workflow mới không thể khởi chạy đồng thời ngăn hệ thống tải xuống các action dependency cần thiết. Trong thời gian xảy ra sự cố, nhiều pipeline kiểm thử, build và triển khai phần mềm bị treo hoặc dừng hoàn toàn.
1779849402659.png

GitHub Actions hiện là một trong những nền tảng CI/CD phổ biến nhất thế giới, được sử dụng bởi hàng triệu repository để tự động hóa quy trình kiểm thử, đóng gói và triển khai phần mềm. Vì vậy, sự cố lần này nhanh chóng tạo ra tác động dây chuyền trên phạm vi toàn cầu.

Nhiều nhóm phát triển cho biết họ không thể merge code, chạy kiểm thử pull request hoặc triển khai bản cập nhật mới trong suốt thời gian gián đoạn. Không ít kỹ sư đã mất hàng chục phút kiểm tra hệ thống nội bộ trước khi nhận ra nguyên nhân thực sự đến từ GitHub.

Bên cạnh GitHub Actions, dịch vụ GitHub Pages cũng ghi nhận tình trạng hoạt động không ổn định, ảnh hưởng tới nhiều website tài liệu kỹ thuật, dự án mã nguồn mở và trang lưu trữ tĩnh đang sử dụng nền tảng này.

Sự cố cũng làm gián đoạn các workflow hiện đại phụ thuộc mạnh vào tự động hóa như AI coding agent, stacked pull request hay các pipeline xác minh mã nguồn liên tục. Một số doanh nghiệp phải tạm thời chuyển sang self-hosted runner hoặc kích hoạt phương án CI/CD dự phòng để duy trì tiến độ phát hành phần mềm.
1779849338035.png

Dù GitHub đã khôi phục toàn bộ dịch vụ và hiện không còn ghi nhận sự cố đang hoạt động, công ty vẫn chưa công bố báo cáo phân tích nguyên nhân chi tiết hay các biện pháp ngăn chặn tái diễn trong tương lai.

Đáng chú ý, đây không phải sự cố lớn duy nhất của GitHub trong hai năm gần đây. Từ năm 2025 đến nay, nền tảng này liên tục ghi nhận nhiều đợt gián đoạn liên quan đến quá tải cơ sở dữ liệu, thiếu hụt runner capacity và các lỗi dây chuyền ảnh hưởng tới hệ thống xác thực, pull request cũng như các tính năng AI như GitHub Copilot.

Chuỗi sự cố liên tiếp đang làm dấy lên lo ngại về mức độ phụ thuộc ngày càng lớn của ngành công nghệ vào hạ tầng GitHub. Nhiều tổ chức bắt đầu cân nhắc chiến lược multi-CI hoặc triển khai hệ thống CI/CD nội bộ nhằm giảm rủi ro từ mô hình “single point of failure”.

Sự cố lần này tiếp tục cho thấy chỉ một gián đoạn ngắn trên hạ tầng phát triển phần mềm cốt lõi cũng có thể tạo ra hiệu ứng domino trên quy mô toàn cầu, ảnh hưởng trực tiếp tới tiến độ phát hành sản phẩm, vận hành dịch vụ và chuỗi cung ứng phần mềm hiện đại.​
 
Mời các bạn tham gia Group WhiteHat để thảo luận và cập nhật tin tức an ninh mạng hàng ngày.
Lưu ý từ WhiteHat: Kiến thức an ninh mạng để phòng chống, không làm điều xấu. Luật pháp liên quan
Thẻ
authentication issue ci/cd github github actions github outage github pages lỗi xác thực pipeline ci/cd workflow automation
Bên trên