Khóa học Phân tích dữ liệu bằng Python sẽ trang bị cho học viên những kiến thức và kỹ năng cần thiết để xử lý, thao tác, phân tích và trực quan hóa các kết quả dựa trên bộ dữ liệu, thông qua ngôn ngữ lập trình thông dụng trong lĩnh vực khoa học dữ liệu.
Kết thúc khóa học, học viên có thể:
Hiểu được nguyên tắc xử lý và quy trình trong phân tích dữ liệu
Hiểu được nền tảng ngôn ngữ lập trình phân tích dữ liệu: biến, hàm, kiểu dữ liệu, cấu trúc dữ liệu,…
Biết cách xử lý, thao tác và phân tích trên các tập dữ liệu
Làm thế nào để biểu diễn trực quan dữ liệu
Biết phân tích dữ liệu bằng các phương pháp thống kê và học máy
Có thể áp dụng ngôn ngữ lập trình vào một số ứng dụng cơ bản
ĐỐI TƯỢNG
Sinh viên muốn trang bị thêm kiến thức về khoa học dữ liệu, phân tích dữ liệu với ngôn ngữ lập trình Python.
Những người đi làm quan tâm đến ứng dụng Python trong lập trình và phân tích dữ liệu doanh nghiệp.
HỌC PHÍ: 3.800.000 VNĐ/HV
Giảm 20% cho 5 học viên đăng ký đầu tiên.
Giảm 20% cho sinh viên hệ chính quy UEH (đang theo học trong thời hạn)
Giảm 15% học phí cho học viên cao học, văn bằng 2, liên thông của UEH.
Giảm 10% cho đối tượng là sinh viên (ngoài UEH).
Giảm 5% học phí cho cựu sinh viên UEH.
THỜI GIAN MỞ LỚP:
– Khai giảng ngày 23/09/2024 (Thứ 2 – 4 – 6; 18h00 – 20h45)
THỜI GIAN HỌC: 10 buổi
HÌNH THỨC HỌC TẬP:
– Khóa học Hybrid (Online) và Offline Trực tiếp tại Đại học Kinh tế TP. Hồ Chí Minh – UEH
CẤU TRÚC CHƯƠNG TRÌNH
Buổi | Nội dung |
1 | GIỚI THIỆU VỀ MỤC TIÊU KHÓA HỌCKHOA HỌC DỮ LIỆU– Khoa học dữ liệu và phân tích dữ liệu– Các ngôn ngữ lập trình phân tích dữ liệu– Nhu cầu thị trường– Quy trình phân tích dữ liệu– Tại sao là Python?PYTHON CƠ BẢN – PHẦN 1– Môi trường phát triển– Cài đặt các công cụ cần thiết– Biến– Kiểu dữ liệu– Ghi chú– Toán tử– Nhập, xuất dữ liệu– Các loại lỗi trong lập trình– Bài tập liên quan |
2 | PYHON CƠ BẢN – PHẦN 2– Biểu thức Boolean– Cấu trúc điều khiển– Phép so sánh– Cấu trúc vòng lặp– Các hàm toán học phổ biến– Xử lý Chuỗi và các hàm phổ biến– Cấu trúc mảng/danh sách– Bài tập thực tế liên quan |
3 | XỬ LÝ DỮ LIỆU – PHẦN 1– Lập chỉ mục và chọn lọc dữ liệu– Thao thác dữ liệu với cấu trúc Series– Thao thác dữ liệu với cấu trúc DataFrame– Biến đổi dữ liệu– Kết hợp các tập dữ liệu– Tổng hợp và nhóm dữ liệu– Bài tập thực tế liên quan |
4 | XỬ LÝ DỮ LIỆU – PHẦN 2– Quy trình khai phá dữ liệu (EDA)– Xử lý dữ liệu khuyết thiếu– Xử lý dữ liệu với Excel/CSV– Bài tập thực tế liên quan |
5 | TRỰC QUAN HÓA DỮ LIỆU– Các loại biểu đồ và ý nghĩa– Trực quan hóa dữ liệu– Thực hành vẽ một số biểu đồ cơ bản– Bài tập thực tế liên quanTHU THẬP DỮ LIỆU– Phương pháp thu thập dữ liệu– Thực hành thu thập dữ liệu từ một số Website nổi tiếng– Bài tập thực tế liên quanXỬ LÝ NGÔN NGỮ TỰ NHIÊN– Quy trình làm sạch dữ liệu ngôn ngữ– Tách từ– Xử lý từ dùng– xóa bỏ dấu câu, ký tự đặc biệt– Chuẩn hóa từ– Bài tập thực tế liên quan |
6 | XỬ LÝ NGÔN NGỮ TỰ NHIÊN VÀ PHÂN TÍCH CẢM XÚC– Tách câu– Xác định từ loại– Phân nhóm– Phân tích cảm xúc– Bài tập thực tế liên quan |
7 | GIỚI THIỆU VỀ HỌC MÁY– Quy trình triển khai dự án phân tích dữ liệu– Phân loại mô hình máy học– Đánh giá độ chính xác mô hìnhTHUẬT TOÁN: Linear Regression, Logistic RegressionTIỀN XỬ LÝ DỮ LIỆU+ trích xuất đặc trưng+ Xử lý dữ liệu mất cân bằng+ Chuẩn hóa dữ liệu |
8 | – THUẬT TOÁN: K-means– Phân nhóm khách hàng bằng RFM và K-means– Thực hành phân cụm khách hàng |
9 | – THUẬT TOÁN: Decision Tree– Thực hành dự doán phát hiện gian lận giao dịch thẻ tín dụng– Hướng dẫn, góp ý chỉnh sửa đồ án cho từng học viên/nhóm học viên |
10 | TỔNG KẾT KHÓA HỌC |
GIẢNG VIÊN KHÓA HỌC
Thạc sĩ Lê Bá Thiền
Data Engineer Prudential Vietnam