TSF – Giải pháp IT toàn diện cho doanh nghiệp SMB | HCM

Proxmox VE 9 P14: Hướng Dẫn Remove Cluster Group An Toàn trên proxmox (Step-by-Step)

🚀 Proxmox VE 9 – Hướng Dẫn Remove Cluster Group (Step-by-Step)

Trong một số tình huống thực tế, bạn có thể cần gỡ bỏ hoàn toàn cấu hình cluster trong Proxmox VE 9, đặc biệt khi:

  • ❌ Một node bị lỗi vĩnh viễn

  • ❌ Cluster cấu hình sai ngay từ đầu

  • ❌ Lab cần rebuild lại từ đầu

  • ❌ Corosync mất quorum và không thể khôi phục

  • ❌ Muốn chuyển node từ cluster về standalone

Nếu thực hiện không đúng quy trình, bạn có thể gặp các lỗi như:

  • Lỗi quorum

  • File cấu hình bị lock

  • Node hiển thị trạng thái không đồng bộ

  • Service cluster không khởi động lại được

Trong bài hướng dẫn này, bạn sẽ thực hiện xóa cluster group trong Proxmox VE 9 một cách an toàn, bao gồm xóa node lỗi và làm sạch toàn bộ cấu hình cluster.

⚠️ Lưu ý: Thực hiện chính xác từng bước theo thứ tự.


🎯 Khi Nào Cần Remove Cluster?

Bạn nên thực hiện quy trình này khi:

  • Node như pve02 không còn sử dụng

  • Node bị hỏng không thể phục hồi

  • Cluster bị lỗi cấu hình nghiêm trọng

  • Muốn tách node khỏi cluster và chạy độc lập

Trước khi bắt đầu, đảm bảo:

  • Tất cả VM đã shutdown

  • Đã backup dữ liệu quan trọng

  • Hiểu rằng thao tác này không thể hoàn tác


🛑 Step 1: Shutdown all running VMs

Trước khi chỉnh sửa cấu hình cluster, bắt buộc phải tắt toàn bộ máy ảo đang chạy để tránh rủi ro mất dữ liệu.

Đảm bảo không còn VM hoặc container nào hoạt động.


🗑 Step 2: Delete the faulty node (not used eg pve02)

Nếu node pve02 không còn sử dụng hoặc đã lỗi vĩnh viễn, tiến hành xóa khỏi cluster.

Trước tiên, ép quorum về 1:

 
pvecm expected 1

Sau đó xóa node:

 
pvecm delnode pve02

Lệnh này sẽ xóa node khỏi danh sách thành viên cluster.

Có thể kiểm tra lại trạng thái:

 
pvecm status

🧹 Step 3: Proceed to remove cluster

Tiếp theo, dừng toàn bộ dịch vụ liên quan đến cluster và làm sạch cấu hình.

Dừng service cluster:

 
systemctl stop pve-cluster systemctl stop corosync

Khởi động pmxcfs ở chế độ local:

 
pmxcfs -l

Xóa file cấu hình Corosync:

 
rm /etc/pve/corosync.conf

Xóa thư mục Corosync:

 
rm -r /etc/corosync/*

Xóa thư mục node cluster:

 
rm -rf /etc/pve/nodes/pve02

Kill tiến trình pmxcfs:

 
killall pmxcfs

Khởi động lại dịch vụ cluster:

 
systemctl start pve-cluster

Sau bước này, cấu hình cluster đã được loại bỏ và node sẽ trở về trạng thái standalone.


🔄 Step 4: Reboot host

Cuối cùng, reboot lại máy chủ Proxmox để đảm bảo toàn bộ service khởi động lại sạch sẽ.

Reboot host proxmox

Sau khi reboot, kiểm tra:

  • Không còn thông tin cluster

  • Lệnh pvecm status không hiển thị cluster

  • Web GUI truy cập bình thường


🧠 Điều Gì Xảy Ra Khi Remove Cluster?

Khi thực hiện quy trình này:

  • Corosync bị dừng hoàn toàn

  • Cluster File System (pmxcfs) được reset

  • Membership cluster bị xóa

  • Cấu hình corosync.conf bị loại bỏ

Sau đó, Proxmox sẽ hoạt động như một node độc lập.


⚠️ Các Lỗi Thường Gặp

❌ Không shutdown VM trước khi xóa cluster
❌ Xóa corosync.conf khi service còn chạy
❌ Không set pvecm expected 1 khi mất quorum
❌ Thực hiện trên cluster production còn hoạt động

Luôn kiểm tra kỹ môi trường trước khi thao tác.


🔐 Best Practices Trước Khi Remove Cluster

✔️ Backup VM quan trọng
✔️ Ghi lại topology cluster hiện tại
✔️ Đảm bảo node thực sự không còn dùng
✔️ Kiểm tra HA resource nếu có
✔️ Thực hiện trong maintenance window

Trong môi trường production, nên cân nhắc khôi phục quorum thay vì remove cluster nếu có thể.


🏗 Trường Hợp Ứng Dụng Thực Tế

Quy trình này thường được sử dụng khi:

  • Rebuild homelab Proxmox

  • Lỗi quorum trong cluster 2 node

  • Cấu hình corosync bị hỏng

  • Thiết kế lại hạ tầng cluster

Đặc biệt hữu ích trong môi trường lab nơi node thường xuyên được cài đặt lại.


🎯 Kết Luận

Việc Remove Cluster Group trong Proxmox VE 9 đòi hỏi thao tác chính xác và hiểu rõ cơ chế cluster.

Sau khi hoàn thành các bước:

  • Node lỗi đã được xóa

  • Cấu hình cluster đã được làm sạch

  • Corosync đã được dừng đúng cách

  • Host đã trở về standalone mode

Hiểu rõ cách tạo cluster là quan trọng, nhưng biết cách remove cluster an toàn còn quan trọng hơn trong thực tế vận hành hệ thống.

Tham khảo thêm bài viết cùng chủ đề

P15 – Sao lưu và Khôi phục Máy Ảo Trên Proxmox

P15 – Sao lưu và Khôi phục Máy Ảo Trên Proxmox 🚀 Proxmox VE P15 – Backup và Restore Virtual Machines (Hướng dẫn Full Step-by-Step) Bảo vệ dữ liệu là một trong những trách nhiệm quan trọng nhất của bất kỳ System Administrator nào.Trong Proxmox VE, việc xây dựng chiến...

Read More