navigation

Xây dựng Datalake với dữ liệu của bạn

Tổng quan

Trong workshop này chúng ta sẽ thực hiện xây dựng một serverless data pipeline sử dụng chính dữ liệu của bạn. Bắt đầu bằng việc sử dụng dữ liệu mẫu của bạn lưu trong Amazon S3, chúng ta sẽ đi qua các phần trong workshop tập trung vào việc thực hiện transform (chuyển đổi), analysing(phân tích) và visualizing (biểu diễn) data của bạn.

Sau khi hoàn tất workshop, bạn sẽ có những bước khởi đầu tốt để tiếp tục phát triển data pipeline của mình và đem lại nhiều insights hơn. Chúng ta sẽ tận dụng AWS Glue để làm data catalogue và chạy ETL trên data nằm trong data lake. Amazon Athena được sử dụng để truy vấn data trong data lake và Amazon QuickSight để biểu diễn data.

Trong workshop này chúng ta sẽ sử dụng Region Singapore (ap-southeast-1), bạn có thể lựa chọn region khác tùy ý.

Nội dung

  1. Chuẩn bị
  2. Chuẩn bị Data
  3. Ingestion với Glue
  4. Xây dựng data pipeline
  5. Truy vấn với Athena
  6. Visualization với QuickSight
  7. Dọn dẹp tài nguyên