P23 – Giám sát Ram SQL Server 2022 CPU & Disk I/O Performance
PRTG P23 – Giám sát SQL Server 2022: CPU, RAM & Disk I/O Performance
Trong môi trường production, việc SQL Server “đang chạy” không có nghĩa là hệ thống đang ổn định. Rất nhiều sự cố hiệu năng xuất phát từ tài nguyên hệ thống như CPU, RAM hoặc Disk I/O trước khi SQL thực sự dừng dịch vụ.
Trong bài viết này, bạn sẽ học cách triển khai Giám sát Ram SQL Server kết hợp CPU và Disk I/O bằng PRTG thông qua các SSH sensor trên Linux.
Nội dung bao gồm:
Theo dõi Disk Read/Write
Phân tích Disk Latency
Giám sát CPU Load Average
Theo dõi RAM sử dụng cho SQL workload
Đây là tầng giám sát hệ thống giúp bạn đảm bảo SQL Server vận hành ổn định dưới tải cao.
#4. Disk I/O + Disk Latency
Hiệu năng disk là yếu tố cực kỳ quan trọng đối với SQL Server.
Theo dõi:
o Disk Read/Write
o Avg. Disk Queue Length
o Disk Latency
Sensor sử dụng: SSH Script Advanced
Kiểm tra danh sách disk:
Step 1: Tạo file script
🔧 Nội dung Script
#!/bin/bash
DISK="sda"
DATA=$(iostat -dx $DISK 1 2 | awk 'NR>6')
READ=$(echo "$DATA" | awk '{sum+=$3} END {print sum}')
WRITE=$(echo "$DATA" | awk '{sum+=$4} END {print sum}')
AWAIT=$(echo "$DATA" | awk '{sum+=$10} END {print sum}')
UTIL=$(echo "$DATA" | awk '{sum+=$NF} END {print sum}')
cat <<EOF
<prtg>
<result>
<channel>Disk Read KB/s</channel>
<value>${READ:-0}</value>
<unit>Custom</unit>
<customunit>KB/s</customunit>
</result>
<result>
<channel>Disk Write KB/s</channel>
<value>${WRITE:-0}</value>
<unit>Custom</unit>
<customunit>KB/s</customunit>
</result>
<result>
<channel>Disk Latency (await)</channel>
<value>${AWAIT:-0}</value>
<unit>TimeResponse</unit>
</result>
<result>
<channel>Disk Utilization</channel>
<value>${UTIL:-0}</value>
<unit>Percent</unit>
</result>
<text>Disk I/O & Latency check OK</text>
</prtg>
EOF
exit 0🔐 Phân quyền & Cài đặt Dependency
Cấp quyền thực thi:
Cài đặt công cụ theo dõi hiệu năng hệ thống Linux:
sudo apt install sysstat -y
📊 Channel sau khi thêm sensor
| Channel | Ý nghĩa |
|---|---|
| Disk Read KB/s | Lưu lượng đọc của SQL |
| Disk Write KB/s | Lưu lượng ghi của SQL |
| Disk Latency (await) | Chỉ số cực kỳ quan trọng với SQL |
| Disk Utilization | % disk đang bận |
Disk Latency là yếu tố nhạy cảm nhất. Nếu latency cao, SQL sẽ chậm ngay cả khi CPU và RAM vẫn còn dư.
Test Script
Step 2: Cấu hình cảnh báo
Sau khi thêm sensor vào PRTG, cấu hình threshold phù hợp với workload thực tế.
#5. CPU cho SQL
👉 Sensor: SSH Load Average v2 (NEW)
Theo dõi:
• Load average
o 1 minute
o 5 minutes ⭐ (quan trọng nhất)
o 15 minutes
📌 Trên Linux:
Load ≠ %CPU.
Load thể hiện mức độ quá tải của hệ thống, không phải phần trăm CPU trực tiếp.
Step 1: Thêm Sensor
Thêm sensor SSH Load Average v2 vào SQL Server.
Step 2: Cấu hình Threshold
Channel: Load Average (5 min) ⭐
Giả sử server có 4 core:
| Level | Value |
|---|---|
| Warning | > 4 |
| Error | > 6 |
📌 Không cấu hình theo %
📌 5-minute average là quan trọng nhất
Ví dụ với 2 Core
Giả sử server có 2 core:
• Load 1.0 = sử dụng 1 core
• Load 2.0 = sử dụng 2 core
• Load 0.08 = sử dụng 0.08 core
👉 0.08 / 2 cores = ~4% tổng công suất
Hiểu đúng Load Average giúp bạn tránh cấu hình cảnh báo sai.
#6. RAM cho SQL
👉 Sensor: SSH Meminfo v2
RAM ảnh hưởng trực tiếp đến buffer pool và hiệu năng truy vấn.
Step 1: Tạo Sensor
Thêm sensor SSH Meminfo v2 vào SQL Server.
Kiểm tra RAM thực tế bằng lệnh:
Lưu ý: Summary VM có thể báo tổng RAM bao gồm cache và các cấu hình hệ thống khác.
Step 2: Cấu hình Threshold
Thiết lập ngưỡng theo chiến lược phân bổ RAM của SQL Server.
Nếu đã cấu hình max memory cho SQL, cần đảm bảo hệ điều hành vẫn còn đủ RAM để hoạt động ổn định.
Tránh cảnh báo giả do Linux sử dụng file cache.
🎯 Vì sao cần Giám sát Ram SQL Server?
Khi triển khai Giám sát Ram SQL Server, bạn đang kiểm soát:
Sự ổn định của buffer pool
Khả năng đáp ứng của hệ điều hành
Nguy cơ quá tải CPU
Hiệu năng hệ thống lưu trữ
Kết hợp:
Disk I/O
CPU Load
RAM Usage
Tạo thành lớp giám sát hạ tầng hoàn chỉnh cho SQL Server.
🚀 Kết luận
Để giám sát SQL Server 2022 trong môi trường production đúng chuẩn, bạn cần theo dõi toàn bộ tài nguyên hệ thống:
Disk I/O & Latency
CPU Load (5 phút)
RAM sử dụng
Threshold hợp lý
Với mô hình này, hệ thống của bạn sẽ không chỉ biết SQL còn chạy hay không, mà còn đánh giá được SQL có đang vận hành ổn định dưới tải thực tế hay không.
Đây là cách tiếp cận chủ động giúp bạn phát hiện sớm sự cố hiệu năng trước khi ảnh hưởng đến người dùng cuối.
Tham khảo thêm bài viết cùng chủ đề
P3 – Giải Pháp Mạnh Mẽ Giám Sát IP WAN Với PRTG
P3 – Giải Pháp Mạnh Mẽ Giám Sát IP WAN Với PRTG PRTG – P3 Giám Sát Internet & WAN IP Với PRTG Network Monitor Việc theo dõi kết nối Internet là yếu tố sống còn trong hạ tầng doanh nghiệp. Khi đường truyền WAN gặp sự cố, các dịch...
Read MoreP2 – Bảo mật PRTG Hiệu Quả: Đổi Port PRTG & SSL
P2 – Bảo mật PRTG Hiệu Quả: Đổi Port PRTG & SSL PRTG – P2 Secure PRTG with SSL | Enable HTTPS & Change Default Port Bảo mật hệ thống giám sát không phải là tùy chọn — đó là yêu cầu bắt buộc. Trong bài viết này, chúng ta...
Read MoreP1 – Hướng Dẫn Cài Đặt PRTG Hoàn Chỉnh Windows 10
P1 – Hướng Dẫn Cài Đặt PRTG Hoàn Chỉnh Windows 10 🚀 Cài đặt PRTG trên Windows 10 – Initial Setup & Configuration (P1) Nếu bạn đang bắt đầu triển khai hệ thống giám sát hạ tầng, thì việc Cài đặt PRTG đúng cách là bước nền tảng cực kỳ...
Read More