TSF – Giải pháp IT toàn diện cho doanh nghiệp SMB | HCM

P5 - Giám Sát Nhiệt Độ Proxmox Bằng PRTG Network Monitor

PRTG – P5 Giám Sát Nhiệt Độ Proxmox Với PRTG Network Monitor

Quá nhiệt máy chủ là một trong những nguyên nhân phổ biến nhất gây downtime ngoài ý muốn. Nhiệt độ cao có thể dẫn đến hỏng phần cứng, shutdown đột ngột, giảm hiệu năng và mất ổn định lâu dài.

Trong bài viết này, bạn sẽ học cách triển khai Giám Sát Nhiệt Độ Proxmox bằng PRTG Network Monitor. Hướng dẫn này giúp quản trị viên theo dõi nhiệt độ CPU và phần cứng theo thời gian thực, phát hiện sớm các dấu hiệu bất thường.

PRTG cung cấp biểu đồ trực quan, lịch sử nhiệt độ và cảnh báo tức thì khi vượt ngưỡng. Khi cấu hình đúng cách, bạn có thể phòng tránh hư hỏng phần cứng và đảm bảo môi trường ảo hóa luôn ổn định.

Cấu hình này phù hợp cho home lab, data center và cả môi trường production.

Đây là một phần trong chuỗi hướng dẫn PRTG Network Monitoring.


🖥 1. APPLICABLE OPERATING SYSTEMS

✔ Ubuntu Server (18.04 → 24.04)
✔ Debian
✔ Proxmox
✔ CentOS / Rocky / Alma
✔ VM, bare-metal, cloud (if SNMP is enabled)

Chỉ cần SNMP được bật, phương pháp này có thể triển khai linh hoạt trên nhiều hệ điều hành Linux.


🔧 Step 1: Configure Proxmox to set the temperature

Trước tiên, cài đặt công cụ đọc cảm biến nhiệt trên Proxmox host.

Run the following commands in order:

 
 
apt update
apt install lm-sensors -y
 

Phát hiện cảm biến:

 
 
sensors-detect
 

Chọn yes, sau đó kiểm tra:

 
 
sensors
 

Nếu hiển thị thông tin nhiệt độ CPU, hệ thống đã sẵn sàng để tích hợp vào giải pháp Giám Sát Nhiệt Độ Proxmox.


🧩 Step 2: CREATE A SCRIPT THAT RETURNS A 1-NUMBER (IN PROXMOX)

Tiếp theo, tạo một script trả về một giá trị số duy nhất để SNMP có thể đọc.

Tạo file script:

 
 
nano /usr/local/bin/cpu_temp_snmp.sh
 

Content:

 
 
#!/bin/bash
cat /sys/class/thermal/thermal_zone0/temp | awk ‘{print $1/1000}’
 

Cấp quyền thực thi:

 
 
chmod +x /usr/local/bin/cpu_temp_snmp.sh
 

Test script:

 
 
/usr/local/bin/cpu_temp_snmp.sh
 

Kết quả trả về phải là một con số đại diện cho nhiệt độ CPU (°C).

Script này đảm bảo SNMP nhận dữ liệu dạng số thuần, phù hợp với PRTG Custom Sensor.


🌐 Step 3: DECLARE SNMP EXTEND

Bây giờ tích hợp script vào SNMP.

Edit file:

 
 
nano /etc/snmp/snmpd.conf
 

Add / and ensure it includes:

 
 
view all included .1
access public “” any noauth exact all all none
extend cpuTemp /usr/local/bin/cpu_temp_snmp.sh
 

Restart:

 
 
systemctl restart snmpd
 

⚠ Note: This step must be performed after declaring SNMP in the previous video.

Dòng extend cpuTemp giúp SNMP expose giá trị script thông qua OID để PRTG có thể truy vấn.


📊 Step 4: Add SNMP Custom Advanced Sensor

Truy cập PRTG và thêm sensor mới:

Add Sensor → SNMP Custom Advanced

Cấu hình như sau:


Channel #1 Name

 
 
CPU Temperature
 

Channel #1 OID

COPY THIS LINE

 
 
1.3.6.1.4.1.8072.1.3.2.3.1.1.7.99.112.117.84.101.109.112
 

Quick explanation: cpuTemp → ASCII:

Sau khi thêm sensor, chỉnh Channel setting:

  • Upper error: 85

  • Warning: 70

Cấu hình này có nghĩa:

  • Cảnh báo Warning khi nhiệt độ vượt 70°C

  • Cảnh báo Error khi vượt 85°C

Bạn có thể điều chỉnh ngưỡng tùy theo thông số phần cứng thực tế.


📈 Vì Sao Cần Giám Sát Nhiệt Độ Proxmox?

Triển khai Giám Sát Nhiệt Độ Proxmox mang lại nhiều lợi ích:

  • 🌡 Theo dõi nhiệt độ CPU theo thời gian thực

  • 🚨 Cảnh báo quá nhiệt ngay lập tức

  • 📊 Xem biểu đồ lịch sử nhiệt độ

  • 🛡 Bảo vệ phần cứng

  • ⚡ Duy trì hiệu năng ổn định

Trong môi trường ảo hóa, tải CPU cao thường đi kèm nhiệt độ tăng mạnh. Nếu không giám sát, nguy cơ quá nhiệt sẽ ảnh hưởng trực tiếp đến toàn bộ VM.


🛡 Best Practices Khi Giám Sát Nhiệt Độ

Để đảm bảo hiệu quả:

  • Kiểm tra luồng gió và hệ thống làm mát

  • Theo dõi thêm nhiệt độ ổ đĩa nếu có thể

  • Thiết lập threshold phù hợp với khuyến nghị của hãng

  • Kiểm tra biểu đồ nhiệt độ định kỳ

  • Kết hợp giám sát CPU Load và Temperature

Nhiệt độ và tải hệ thống thường có mối liên hệ trực tiếp.


📌 Tổng Kết

Với cấu hình trên, bạn đã triển khai thành công Giám Sát Nhiệt Độ Proxmox bằng PRTG Network Monitor thông qua SNMP Custom Sensor.

Bằng cách kết hợp lm-sensors, script shell đơn giản, SNMP extend và SNMP Custom Advanced sensor trong PRTG, bạn có thể theo dõi nhiệt độ CPU theo thời gian thực một cách chính xác và chuyên nghiệp.

Giải pháp này giúp giảm thiểu rủi ro hỏng phần cứng, ngăn chặn downtime do quá nhiệt và nâng cao độ ổn định cho hệ thống ảo hóa.

Ở phần tiếp theo, chúng ta sẽ tiếp tục mở rộng khả năng giám sát Proxmox với các cấu hình nâng cao hơn trong PRTG.

Tham khảo thêm bài viết cùng chủ đề

P3 – Giải Pháp Mạnh Mẽ Giám Sát IP WAN Với PRTG

P3 – Giải Pháp Mạnh Mẽ Giám Sát IP WAN Với PRTG PRTG – P3 Giám Sát Internet & WAN IP Với PRTG Network Monitor Việc theo dõi kết nối Internet là yếu tố sống còn trong hạ tầng doanh nghiệp. Khi đường truyền WAN gặp sự cố, các dịch...

Read More

P1 – Hướng Dẫn Cài Đặt PRTG Hoàn Chỉnh Windows 10

P1 – Hướng Dẫn Cài Đặt PRTG Hoàn Chỉnh Windows 10 🚀 Cài đặt PRTG trên Windows 10 – Initial Setup & Configuration (P1) Nếu bạn đang bắt đầu triển khai hệ thống giám sát hạ tầng, thì việc Cài đặt PRTG đúng cách là bước nền tảng cực kỳ...

Read More