raw
├── TABLE-NAME-1
│ ├── LOAD00000001.csv
│ └── LOAD00000002.csv
└── TABLE-NAME-2
├── LOAD00000001.csv
└── LOAD00000002.csv
raw
├── listings
│ ├── LOAD00000001.csv
└── reviews
├── LOAD00000001.csv
Cấu trúc dữ liệu của bạn trong Amazon S3 để mỗi bảng sẽ nằm trong một thư mục riêng biệt, với toàn bộ dữ liệu trong nhóm riêng biệt
Trong bước này, bạn đã tải Dataset thành công và upload lên Cloud9 instance.Tiếp theo chúng ta sẽ kiểm tra encoding để đảm bảo dữ liệu được encode dạng UTF-8.