IC3 GS5 Online chỉ với 900k/3 học phần
Luyện MOS 2016 online chỉ với 300k
Tài khoản luyện thi MOS Gmetrix chỉ với 300k/tài khoản
Previous
Next
  1. MỤC TIÊU

Trang bị cho học viên những kiến thức và kỹ năng cần thiết để xử lý, thao tác, phân tích và trực quan hóa các kết quả dựa trên bộ dữ liệu, thông qua ngôn ngữ lập trình thông dụng trong lĩnh vực khoa học dữ liệu.

Kết thúc khóa học, học viên có thể:

  • Hiểu được nguyên tắc xử lý và quy trình trong phân tích dữ liệu
  • Hiểu được nền tảng ngôn ngữ lập trình phân tích dữ liệu: biến, hàm, kiểu dữ liệu, cấu trúc dữ liệu,…
  • Biết cách xử lý, thao tác và phân tích trên các tập dữ liệu
  • Làm thế nào để biểu diễn trực quan dữ liệu
  • Biết phân tích dữ liệu bằng các phương pháp thống kê và học máy
  • Có thể áp dụng ngôn ngữ lập trình vào một số ứng dụng cơ bản
  1. ĐỐI TƯỢNG
  • Sinh viên muốn trang bị thêm kiến thức về khoa học dữ liệu, phân tích dữ liệu với ngôn ngữ lập trình Python.
  • Những người đi làm quan tâm đến ứng dụng Python trong lập trình và phân tích dữ liệu doanh nghiệp.
  1. HỌC PHÍ
  • Học phí: 1.500.000đ/học viên
  • Giảm giá cho học viên đăng ký theo nhóm
  • Giảm giá cho sinh viên Trường Đại học Kinh tế TP. HCM

 

 

  1. NỘI DUNG

Buổi

Nội dung

1

Bài 1: Tổng quan về lập trình phân tích dữ liệu

–      Khoa học dữ liệu và phân tích dữ liệu

–      Các ngôn ngữ lập trình phân tích dữ liệu

–      Tại sao là Python?

–      Môi trường phát triển

–      Cài đặt các công cụ cần thiết

2,3

Bài 2: Ngôn ngữ lập trình Python

–      Kiểu dữ liệu

–      Biến và hàm

–      Cấu trúc điều khiển

–      Vòng lặp

–      Cấu trúc mảng

–      Tính toán, so sánh, sắp xếp mảng

–      Các cấu trúc dữ liệu

–      Làm việc với tập tin và các nguồn dữ liệu

–      Làm các bài tập

4,5

Bài 3: Thao tác phân tích dữ liệu

–      Lập chỉ mục và chọn lọc dữ liệu

–      Thao thác dữ liệu với Pandas

–      Xử lý dữ liệu khuyết

–      Biến đổi dữ liệu

–      Kết hợp các tập dữ liệu

–      Tổng hợp và nhóm dữ liệu

–      Pivot Tables

–      Chuỗi thời gian

6

Bài 4: Biểu diễn trực quan dữ liệu

–      Làm việc với thư viện Matplotlib

–      Vẽ các biểu đồ đơn giản

–      Tùy biến các đối tượng trên biểu đồ: trục tọa độ, tiêu đề, chú thích, nhiều biểu đồ trên 1 màn hình,..

–      Các biểu đồ phổ biến để hình dung dữ liệu và các kết quả phân tích:

+ Biểu đồ tần suất (Histogram)

+ Biểu đồ đường (Line)

+ Biểu đồ phân tán (Scatter)

+ Biểu đồ thanh (Bar)

+ Biểu đồ 3D

+ Kết hợp nhiều biểu đồ

7,8

Bài 5: Máy học và ứng dụng

–      Làm việc với các thư viện Statsmodels và Scikit-Learn

–      Phân loại các mô hình máy học

–      Thực nghiệm và đánh giá mô hình

–      Một số mô hình và ứng dụng

+ Naive Bayes Classification

+ Linear Regression

+ Support Vector Machines

+ Decision Trees and Random Forests

+ Principal Component Analysis

+ k-Means Clustering

9

Tổng hợp kiến thức, Chia sẻ kinh nghiệm, Giải đáp thắc mắc