Module 4 - Tuần 3: Tree Review & LightGBM – Cây cối nở rộ và nở hoa với Time-series
Tuần 3 là tuần 'cây cối nở rộ': chúng ta ôn tập toàn bộ họ nhà Tree từ Random Forest đến XGBoost, rồi học LightGBM và SHAP, kèm MLOps với Docker và project dự báo doanh số!
- 3 min read

🎉 Chào mừng đến với blog Tuần 3 – Module 4 của AIO Course 2025!
🌟 Giới thiệu
Nếu tuần trước chúng ta dừng lại ở Gradient Boosting & XGBoost, thì tuần này là một hành trình tổng hợp:
- Ôn tập toàn bộ dòng họ Tree-based models.
- Khám phá LightGBM – “người kế vị tốc độ” của Gradient Boosting.
- Thực hành MLOps cơ bản với Docker.
- Project thực tế: Sales Forecasting với Explainable AI (LightGBM + SHAP + Optuna + Streamlit).
📅 Lịch trình tuần học
🗓️ Thứ Ba – 16/09/2025
🔥 Warm-up: Cơ bản về XGBoost (Extra class)
Instructor: TA Đình Thắng
- Thảo luận tổng quát về giải thuật XGBoost.
- Làm ví dụ tính tay đơn giản, sau đó cài đặt lại bằng Python.
🗓️ Thứ Tư – 17/09/2025
🌲 Tree Review – Tổng hợp lý thuyết (Main session)
Instructor: Dr. Đình Vinh
- Ôn tập toàn bộ các giải thuật dựa trên cây: Decision Tree, Random Forest, Gradient Boosting, XGBoost.
- Thảo luận ứng dụng vào bài toán time-series.
- So sánh ưu/nhược điểm từng mô hình khi dữ liệu thay đổi theo thời gian.
🗓️ Thứ Năm – 18/09/2025
⚙️ Basic MLOps: Docker for ML
Instructor: TA Dương Thuận
- Giới thiệu về Docker: container, image, registry.
- Các bước đóng gói & triển khai mô hình ML trong Docker.
- Thảo luận về Docker Compose, Docker Swarm và ứng dụng trong ML pipeline.
🗓️ Thứ Sáu – 19/09/2025
⚡ LightGBM & SHAP (Main session)
Instructor: Dr. Quang Vinh
- Nhược điểm của Gradient Boosting và cách LightGBM giải quyết bằng histogram-based, leaf-wise growth, GOSS, EFB.
- LightGBM trong classification và regression.
- Giới thiệu nhanh về SHAP để giải thích mô hình (model interpretability).
🗓️ Thứ Bảy – 20/09/2025
📊 Project: Sales Forecasting with Explainable AI
Instructor: Dr. Thái Hà
- Đề bài: Dự báo doanh số bán hàng (time-series).
- Giải bài toán bằng LightGBM + SHAP.
- Tối ưu tham số với Optuna.
- Triển khai giao diện nhanh bằng Streamlit.
🗓️ Chủ Nhật – 21/09/2025
💪 Exercise Session: Tree Review & LightGBM
Instructor: TA Quốc Thái
- Ôn nhanh nội dung chính của buổi Tree Review (Thứ 4) và LightGBM (Thứ 6).
- Giải các bài tập tổng hợp: từ tính tay entropy/gini → chạy code → đọc kết quả SHAP.
🎯 Mục tiêu học tập
📌 Tree Review
- Hệ thống lại các mô hình cây: Decision Tree, Random Forest, Gradient Boosting, XGBoost.
- So sánh khả năng áp dụng trong time-series.
📌 LightGBM
- Hiểu rõ cải tiến của LightGBM: histogram-based, leaf-wise, GOSS, EFB.
- Biết cách tính toán tại lá: ( w^* = -G / (H+\lambda) ).
- Dùng SHAP để giải thích mô hình.
📌 MLOps với Docker
- Biết cách container hoá và triển khai ML models.
- Hiểu vai trò của Compose, Swarm trong hệ thống ML.
📌 Project thực tế
- Tích hợp LightGBM, Optuna, SHAP và Streamlit.
- Giải quyết bài toán dự báo doanh số – một ứng dụng phổ biến của AI trong kinh doanh.
📂 Tài liệu đi kèm:
M4W4D2D4_All_about_tree
M4W3D3_DockerForML
🧠 Repository được quản lý bởi Time Series Team Hub