Cấu hình role cho AWS Glue
Cấu hình role cho AWS Glue
- Truy cập vào dịch vụ IAM
- Click Policies.
- Click Create Policy.
- Click tab JSON, copy nội dung policy dưới đây.
- Chỉnh sửa lại YOUR-BUCKET-NAME thành tên của S3 bucket.
- Click Next: Tags.
{
"Version": "2012-10-17",
"Statement": [
{
"Sid": "s0",
"Effect": "Allow",
"Action": [
"s3:PutObject",
"s3:GetObject",
"s3:ListBucket",
"s3:DeleteObject"
],
"Resource": [
"arn:aws:s3:::YOUR-BUCKET-NAME",
"arn:aws:s3:::YOUR-BUCKET-NAME/*"
]
}
]
}
- Click Next: Review.
- Tại mục Review policy đặt Name policy là yourname-datalake-policy.
- Click Create policy.
- Click Role, sau đó click Create role.
- Click chọn AWS service.
- Click chọn Glue.
- Click Next: Permissions.
- Tại mục Attach permissions policies.
- Điền datalake để tìm kiếm policy.
- Click chọn policy yourname-datalake-policy.
- Tiếp tục tại mục Attach permissions policies.
- Điền glueservice để tìm kiếm policy.
- Click chọn policy AWSGlueServiceRole.
- Click Next: Tags, sau đó click Next: Review.
- Đặt Role name là AWSGlueServiceRole-yourname-datalake.
- Click Create role.
Ở bước này chúng ta đã tạo Role để cấp quyền cho tiến trình Glue Crawler ở bước tiếp theo. Trong bước tiếp theo chúng ta sẽ tạo Crawler job để khám phá dữ liệu và lưu thông tin metadata vào Glue data catalog.