Module 2 - Tuần 2: Xác Suất, Cơ Sở Dữ Liệu và Những Pha Bayes “Khét Lẹt”!

Tuần học thứ 2 đã tiếp tục mở rộng hiểu biết về Xác Suất

  • 3 min read
Photo by Nasa on Unsplash

🎉 Chào mừng đến với blog Tuần 2 của team Time Series!

Tuần học thứ 2 đã tiếp tục mở rộng hiểu biết về Xác Suất – một trong những nền tảng quan trọng nhất để phát triển mô hình AI, cùng với các ứng dụng thực tiễn trong MongoDB và thuật toán Naive Bayes Classifier. Hãy cùng nhìn lại mỗi buổi học trong tuần này nhé! Bạn nhớ xem chi tiết kiến thức bao gồm kiến thức mở rộng của từng lớp học ở tài liệu đính kèm nhé!


📅 Lịch trình học và nội dung chính

🧑‍🏫 Thứ 3 – Ngày 08/07/2025

(Buổi warm-up – TA Quốc Thái)

Chủ đề: Cơ bản về Xác Suất

  • Tính marginal probability và joint probability
  • Bayes theorem
  • Naive Bayes Classification (tư duy và áp dụng thực tiễn)

👨‍🎓 Thứ 4 – Ngày 09/07/2025

(Buổi học chính – Dr. Quang Vinh)

Chủ đề: Xác Suất cơ bản cho AI

  • Các khái niệm nền tảng: biến ngẫu nhiên, biến rời rạc, luật tổng, luật nhân
  • Bayes Theorem trong AI
  • Minh họa bằng bài toán AI định danh

🧑‍🎓 Thứ 5 – Ngày 10/07/2025

(Buổi học nâng cao – Dr. Đình Vinh)

Chủ đề: NoSQL – MongoDB (phần 2)

  • Aggregation pipeline trong MongoDB
  • Index và Partial Index
  • Kết nối MongoDB với Python (PyMongo), demo trực tiếp

👨‍🎓 Thứ 6 – Ngày 11/07/2025

(Buổi học chính – Dr. Quang Vinh)

Chủ đề: Naive Bayes Classifier

  • Naive Bayes cho dữ liệu rời rạc (categorical)
  • Naive Bayes cho dữ liệu liên tục (Gaussian Naive Bayes)
  • Bài toán ứng dụng trong AI: Play Tennis, Traffic Prediction, Iris Classification

👨‍🎓 Chủ nhật – Ngày 13/07/2025

(Buổi ứng dụng thực hành – MSc. Quốc Thái)

Chủ đề: Xác Suất và Naive Bayes trong thực tế

  • Ôn lại khái niệm then chốt trong Xác Suất và Bayes
  • Hướng dẫn tự tay giải bài: Play Tennis, Traffic Data, Iris Dataset
  • Áp dụng Gaussian Likelihood trong dự đoán AI

📌 Tổng hợp kiến thức & điểm nhấn

Xác Suất cơ bản & Bayes

  • Nắm được marginal, joint và conditional probability
  • Bayes Theorem: cốt lõi cho nhiều bài toán AI
  • Phân biệt MAP và MLE, áp dụng lược bỏ mẫu số

MongoDB & PyMongo

  • Aggregation pipeline (match, group, sort, project, …)
  • Tối ưu tìm kiếm với index và partial index
  • Kết nối MongoDB với Python, đọc ghi collection bằng code

Naive Bayes Classifier

  • Cách tính likelihood trong biến rời rạc và Gaussian cho biến liên tục
  • Giải bài toán Play Tennis, Traffic Delay, Iris Classification
  • Xử lý underflow khi nhân nhiều xác suất bằng log likelihood

📂 Tài liệu đi kèm:

M2W2D3+4_Probability
📄 M2W2D3+4_Probability
M2W2D5_Database_NoSQL(2)
📄 M2W2D5_Database_NoSQL(2)
M2W2D6_NaiveBayesClassification
📄 M2W2D6_NaiveBayesClassification
M2W2D8_Probability_Exercise
📄 M2W2D8_Probability_Exercise


🧠 Repository managed by Time Series Team Hub

Recommended for You