TSF – Giải pháp IT toàn diện cho doanh nghiệp SMB | HCM

P23 – Giám sát Ram SQL Server 2022 CPU & Disk I/O Performance

PRTG P23 – Giám sát SQL Server 2022: CPU, RAM & Disk I/O Performance

Trong môi trường production, việc SQL Server “đang chạy” không có nghĩa là hệ thống đang ổn định. Rất nhiều sự cố hiệu năng xuất phát từ tài nguyên hệ thống như CPU, RAM hoặc Disk I/O trước khi SQL thực sự dừng dịch vụ.

Trong bài viết này, bạn sẽ học cách triển khai Giám sát Ram SQL Server kết hợp CPU và Disk I/O bằng PRTG thông qua các SSH sensor trên Linux.

Nội dung bao gồm:

  • Theo dõi Disk Read/Write

  • Phân tích Disk Latency

  • Giám sát CPU Load Average

  • Theo dõi RAM sử dụng cho SQL workload

Đây là tầng giám sát hệ thống giúp bạn đảm bảo SQL Server vận hành ổn định dưới tải cao.


#4. Disk I/O + Disk Latency

Hiệu năng disk là yếu tố cực kỳ quan trọng đối với SQL Server.

Theo dõi:

o Disk Read/Write
o Avg. Disk Queue Length
o Disk Latency

Sensor sử dụng: SSH Script Advanced

Kiểm tra danh sách disk:

 
 
lsblk
 

Step 1: Tạo file script

 
 
sudo nano /var/prtg/scriptsxml/check_disk_io_latency.sh
 

🔧 Nội dung Script

 
💻
filename.bash
#!/bin/bash

DISK="sda"  


DATA=$(iostat -dx $DISK 1 2 | awk 'NR>6')

READ=$(echo "$DATA" | awk '{sum+=$3} END {print sum}')
WRITE=$(echo "$DATA" | awk '{sum+=$4} END {print sum}')
AWAIT=$(echo "$DATA" | awk '{sum+=$10} END {print sum}')
UTIL=$(echo "$DATA" | awk '{sum+=$NF} END {print sum}')

cat <<EOF
<prtg>

  <result>
    <channel>Disk Read KB/s</channel>
    <value>${READ:-0}</value>
    <unit>Custom</unit>
    <customunit>KB/s</customunit>
  </result>

  <result>
    <channel>Disk Write KB/s</channel>
    <value>${WRITE:-0}</value>
    <unit>Custom</unit>
    <customunit>KB/s</customunit>
  </result>

  <result>
    <channel>Disk Latency (await)</channel>
    <value>${AWAIT:-0}</value>
    <unit>TimeResponse</unit>
  </result>

  <result>
    <channel>Disk Utilization</channel>
    <value>${UTIL:-0}</value>
    <unit>Percent</unit>
  </result>

  <text>Disk I/O & Latency check OK</text>
</prtg>
EOF

exit 0

🔐 Phân quyền & Cài đặt Dependency

Cấp quyền thực thi:

 
 
sudo chmod +x /var/prtg/scriptsxml/check_disk_io_latency.sh
 

Cài đặt công cụ theo dõi hiệu năng hệ thống Linux:

 
 
sudo apt update
sudo apt install sysstat -y
 

📊 Channel sau khi thêm sensor

ChannelÝ nghĩa
Disk Read KB/sLưu lượng đọc của SQL
Disk Write KB/sLưu lượng ghi của SQL
Disk Latency (await)Chỉ số cực kỳ quan trọng với SQL
Disk Utilization% disk đang bận

Disk Latency là yếu tố nhạy cảm nhất. Nếu latency cao, SQL sẽ chậm ngay cả khi CPU và RAM vẫn còn dư.


Test Script

 
 
sudo /var/prtg/scriptsxml/check_disk_io_latency.sh
 

Step 2: Cấu hình cảnh báo

Sau khi thêm sensor vào PRTG, cấu hình threshold phù hợp với workload thực tế.


#5. CPU cho SQL

👉 Sensor: SSH Load Average v2 (NEW)

Theo dõi:

• Load average
o 1 minute
o 5 minutes ⭐ (quan trọng nhất)
o 15 minutes

📌 Trên Linux:

Load ≠ %CPU.
Load thể hiện mức độ quá tải của hệ thống, không phải phần trăm CPU trực tiếp.


Step 1: Thêm Sensor

Thêm sensor SSH Load Average v2 vào SQL Server.


Step 2: Cấu hình Threshold

Channel: Load Average (5 min)

Giả sử server có 4 core:

LevelValue
Warning> 4
Error> 6

📌 Không cấu hình theo %
📌 5-minute average là quan trọng nhất


Ví dụ với 2 Core

Giả sử server có 2 core:

• Load 1.0 = sử dụng 1 core
• Load 2.0 = sử dụng 2 core
• Load 0.08 = sử dụng 0.08 core

👉 0.08 / 2 cores = ~4% tổng công suất

Hiểu đúng Load Average giúp bạn tránh cấu hình cảnh báo sai.


#6. RAM cho SQL

👉 Sensor: SSH Meminfo v2

RAM ảnh hưởng trực tiếp đến buffer pool và hiệu năng truy vấn.


Step 1: Tạo Sensor

Thêm sensor SSH Meminfo v2 vào SQL Server.

Kiểm tra RAM thực tế bằng lệnh:

 
 
free -h
 

Lưu ý: Summary VM có thể báo tổng RAM bao gồm cache và các cấu hình hệ thống khác.


Step 2: Cấu hình Threshold

Thiết lập ngưỡng theo chiến lược phân bổ RAM của SQL Server.

Nếu đã cấu hình max memory cho SQL, cần đảm bảo hệ điều hành vẫn còn đủ RAM để hoạt động ổn định.

Tránh cảnh báo giả do Linux sử dụng file cache.


🎯 Vì sao cần Giám sát Ram SQL Server?

Khi triển khai Giám sát Ram SQL Server, bạn đang kiểm soát:

  • Sự ổn định của buffer pool

  • Khả năng đáp ứng của hệ điều hành

  • Nguy cơ quá tải CPU

  • Hiệu năng hệ thống lưu trữ

Kết hợp:

  • Disk I/O

  • CPU Load

  • RAM Usage

Tạo thành lớp giám sát hạ tầng hoàn chỉnh cho SQL Server.


🚀 Kết luận

Để giám sát SQL Server 2022 trong môi trường production đúng chuẩn, bạn cần theo dõi toàn bộ tài nguyên hệ thống:

  • Disk I/O & Latency

  • CPU Load (5 phút)

  • RAM sử dụng

  • Threshold hợp lý

Với mô hình này, hệ thống của bạn sẽ không chỉ biết SQL còn chạy hay không, mà còn đánh giá được SQL có đang vận hành ổn định dưới tải thực tế hay không.

Đây là cách tiếp cận chủ động giúp bạn phát hiện sớm sự cố hiệu năng trước khi ảnh hưởng đến người dùng cuối.

Tham khảo thêm bài viết cùng chủ đề

P3 – Giải Pháp Mạnh Mẽ Giám Sát IP WAN Với PRTG

P3 – Giải Pháp Mạnh Mẽ Giám Sát IP WAN Với PRTG PRTG – P3 Giám Sát Internet & WAN IP Với PRTG Network Monitor Việc theo dõi kết nối Internet là yếu tố sống còn trong hạ tầng doanh nghiệp. Khi đường truyền WAN gặp sự cố, các dịch...

Read More

P1 – Hướng Dẫn Cài Đặt PRTG Hoàn Chỉnh Windows 10

P1 – Hướng Dẫn Cài Đặt PRTG Hoàn Chỉnh Windows 10 🚀 Cài đặt PRTG trên Windows 10 – Initial Setup & Configuration (P1) Nếu bạn đang bắt đầu triển khai hệ thống giám sát hạ tầng, thì việc Cài đặt PRTG đúng cách là bước nền tảng cực kỳ...

Read More