Trong bước này, chúng ta sẽ cần tạo môi trường để thực hiện tải, kiểm tra encoding của raw Data set ( tập dữ liệu thô )trước khi upload lên S3 bucket.