1. TỔNG QUAN KHOÁ HỌC

Khóa học Phân tích dữ liệu bằng Python sẽ trang bị cho học viên những kiến thức và kỹ năng cần thiết để xử lý, thao tác, phân tích và trực quan hóa các kết quả dựa trên bộ dữ liệu, thông qua ngôn ngữ lập trình thông dụng trong lĩnh vực khoa học dữ liệu.

Kết thúc khóa học, học viên có thể:

      • Hiểu được nguyên tắc xử lý và quy trình trong phân tích dữ liệu
      • Hiểu được nền tảng ngôn ngữ lập trình phân tích dữ liệu: biến, hàm, kiểu dữ liệu, cấu trúc dữ liệu,…
      • Biết cách xử lý, thao tác và phân tích trên các tập dữ liệu
      • Làm thế nào để biểu diễn trực quan dữ liệu
      • Biết phân tích dữ liệu bằng các phương pháp thống kê và học máy
      • Có thể áp dụng ngôn ngữ lập trình vào một số ứng dụng cơ bản

2. ĐỐI TƯỢNG

      • Sinh viên muốn trang bị thêm kiến thức về khoa học dữ liệu, phân tích dữ liệu với ngôn ngữ lập trình Python.
      • Những người đi làm quan tâm đến ứng dụng Python trong lập trình và phân tích dữ liệu doanh nghiệp.

3. HỌC PHÍ: 3.800.000 VNĐ/HV

Giảm 20% cho 5 học viên đăng ký đầu tiên.

Giảm 20% cho sinh viên hệ chính quy UEH (đang theo học trong thời hạn)

Giảm 15% học phí cho học viên cao học, văn bằng 2, liên thông của UEH.

Giảm 10% cho đối tượng là sinh viên (ngoài UEH).

Giảm 5% học phí cho cựu sinh viên UEH.

4. THỜI GIAN MỞ LỚP:

– Khai giảng ngày 13/05/2024 (Thứ 2 – 4 – 6; 18h00 – 20h45)

5. THỜI GIAN HỌC: 10 buổi

6. HÌNH THỨC HỌC TẬP: 
– Khóa học Hybrid (Online) và Offline Trực tiếp tại Đại học Kinh tế TP. Hồ Chí Minh – UEH

7. CẤU TRÚC CHƯƠNG TRÌNH8. GIẢNG VIÊN KHÓA HỌC

BuổiNội dung
1GIỚI THIỆU VỀ MỤC TIÊU KHÓA HỌC
KHOA HỌC DỮ LIỆU
– Khoa học dữ liệu và phân tích dữ liệu
– Các ngôn ngữ lập trình phân tích dữ liệu
– Nhu cầu thị trường
– Quy trình phân tích dữ liệu
– Tại sao là Python?
PYTHON CƠ BẢN – PHẦN 1
– Môi trường phát triển
– Cài đặt các công cụ cần thiết
– Biến
– Kiểu dữ liệu
– Ghi chú
– Toán tử
– Nhập, xuất dữ liệu
– Các loại lỗi trong lập trình
– Bài tập liên quan
2PYHON CƠ BẢN – PHẦN 2
– Biểu thức Boolean
– Cấu trúc điều khiển
– Phép so sánh
– Cấu trúc vòng lặp
– Các hàm toán học phổ biến
– Xử lý Chuỗi và các hàm phổ biến
– Cấu trúc mảng/danh sách
– Bài tập thực tế liên quan
3XỬ LÝ DỮ LIỆU – PHẦN 1
– Lập chỉ mục và chọn lọc dữ liệu
– Thao thác dữ liệu với cấu trúc Series
– Thao thác dữ liệu với cấu trúc DataFrame
– Biến đổi dữ liệu
– Kết hợp các tập dữ liệu
– Tổng hợp và nhóm dữ liệu
– Bài tập thực tế liên quan
4XỬ LÝ DỮ LIỆU – PHẦN 2
– Quy trình khai phá dữ liệu (EDA)
– Xử lý dữ liệu khuyết thiếu
– Xử lý dữ liệu với Excel/CSV
– Bài tập thực tế liên quan
5TRỰC QUAN HÓA DỮ LIỆU
– Các loại biểu đồ và ý nghĩa
– Trực quan hóa dữ liệu
– Thực hành vẽ một số biểu đồ cơ bản
– Bài tập thực tế liên quan
THU THẬP DỮ LIỆU
– Phương pháp thu thập dữ liệu
– Thực hành thu thập dữ liệu từ một số Website nổi tiếng
– Bài tập thực tế liên quan
XỬ LÝ NGÔN NGỮ TỰ NHIÊN
– Quy trình làm sạch dữ liệu ngôn ngữ
– Tách từ
– Xử lý từ dùng
– xóa bỏ dấu câu, ký tự đặc biệt
– Chuẩn hóa từ
– Bài tập thực tế liên quan
6XỬ LÝ NGÔN NGỮ TỰ NHIÊN VÀ PHÂN TÍCH CẢM XÚC
– Tách câu
– Xác định từ loại
– Phân nhóm
– Phân tích cảm xúc
– Bài tập thực tế liên quan
7GIỚI THIỆU VỀ HỌC MÁY
– Quy trình triển khai dự án phân tích dữ liệu
– Phân loại mô hình máy học
– Đánh giá độ chính xác mô hình
THUẬT TOÁN: Linear Regression, Logistic Regression
TIỀN XỬ LÝ DỮ LIỆU
+ trích xuất đặc trưng
+ Xử lý dữ liệu mất cân bằng
+ Chuẩn hóa dữ liệu
8– THUẬT TOÁN: K-means
– Phân nhóm khách hàng bằng RFM và K-means
– Thực hành phân cụm khách hàng
9– THUẬT TOÁN: Decision Tree
– Thực hành dự doán phát hiện gian lận giao dịch thẻ tín dụng
– Hướng dẫn, góp ý chỉnh sửa đồ án cho từng học viên/nhóm học viên
10TỔNG KẾT KHÓA HỌC

Thạc sĩ Lê Bá Thiền

Data Engineer Prudential Vietnam