Module 6 - Tuần 1 - Đừng yêu một metric duy nhất

Các Thước Đo Đánh Giá Mô Hình Hồi Quy

November 21, 2025
5 min read

Các Thước Đo Đánh Giá Mô Hình Hồi Quy

(Evaluation Metrics for Regression)

Bài viết/bài blog này đi kèm với file LaTeX:

“Các Thước Đo Đánh Giá Mô Hình Hồi Quy (Evaluation Metrics for Regression)”

Dựa trên hai tài liệu chính của Plevris et al. và Muraina et al., bài viết hệ thống lại các thước đo cho bài toán hồi quy và nhấn mạnh một ý quan trọng: Không có một con số nào đủ để “đánh giá mô hình” – luôn cần kết hợp nhiều metric để kể một câu chuyện đầy đủ và trung thực.

🎯 Mục tiêu bài viết

Giải thích trực giác đằng sau các thước đo lỗi trong hồi quy: MB, MAE, MSE, RMSE, các dạng chuẩn hoá (MAPE/MNGE, NME, FGE, UI, IOA), \(R\), VAF, \(R^2\), Adjusted \(R^2\), MASE, RMSSE, v.v.
Minh hoạ bằng ví dụ tính tay và case study (giá nhà, doanh số, outlier, benchmark) để thấy:
- Khi nào metric hoạt động tốt.
- Khi nào metric có thể đánh lừa chúng ta (dữ liệu gần 0, outlier, benchmark quá tốt, v.v.).
Làm rõ sự khác nhau giữa:
- Loss function dùng để huấn luyện mô hình.
- Evaluation metric dùng để đánh giá và báo cáo cho business.
Kết nối với bài toán phân loại (accuracy, precision, recall, F1) qua ví dụ ma trận nhầm lẫn “bác sĩ chẩn đoán mang thai”.

🧩 Nội dung chính

Bài viết được trình bày dạng kể chuyện (narrative), không liệt kê khô cứng, gồm các phần:

1. Giới thiệu

Vì sao đánh giá mô hình quan trọng không kém việc chọn thuật toán.
Câu hỏi “mô hình sai bao nhiêu là chấp nhận được” trong bối cảnh thực tế (dự báo doanh số, dự báo tải trọng, y tế, tài chính,…).

2. Thiết lập ký hiệu & khung bài toán

\(r_i\): giá trị thực, \(p_i\): giá trị dự đoán, \(e_i = p_i - r_i\).
Bài viết tập trung vào hồi quy nhưng nhiều ý có thể chuyển sang classification.

3. Nhóm metric dựa trên sai số tuyệt đối & bình phương

MB, MAE, MSE, RMSE.
Ví dụ giá nhà với 1–2 outlier:
- Thể hiện điểm mạnh của MAE (ít bị kéo bởi outlier)
- Và điểm yếu: MAE có thể “làm mờ” các lỗi cực lớn nếu gói chung vào trung bình.
So sánh MAE và RMSE:
- Khi RMSE » MAE → dấu hiệu đuôi sai số dày hoặc có outlier rất lớn.

4. Metric chuẩn hoá & những cái bẫy thường gặp

Time Series Team Hub

Module 6 - Tuần 1 - Đừng yêu một metric duy nhất

Các Thước Đo Đánh Giá Mô Hình Hồi Quy

(Evaluation Metrics for Regression)

🎯 Mục tiêu bài viết

🧩 Nội dung chính

1. Giới thiệu

2. Thiết lập ký hiệu & khung bài toán

3. Nhóm metric dựa trên sai số tuyệt đối & bình phương

4. Metric chuẩn hoá & những cái bẫy thường gặp

5. \(R\), VAF, \(R^2\), Adjusted \(R^2\)

6. Taylor Diagram & so sánh nhiều mô hình

7. MASE, RMSSE và bài toán nhiều chuỗi thời gian / nhiều sản phẩm

8. Loss vs Metric: MSE, MAE, Huber loss

9. Liên hệ classification: ví dụ chẩn đoán mang thai

10. Kết luận: Đừng yêu một metric duy nhất