Cấu hình role cho AWS Glue

Cấu hình role cho AWS Glue

  1. Truy cập vào dịch vụ IAM
  • Click Policies.
  • Click Create Policy.
  1. Click tab JSON, copy nội dung policy dưới đây.
  • Chỉnh sửa lại YOUR-BUCKET-NAME thành tên của S3 bucket.
  • Click Next: Tags.
{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Sid": "s0",
      "Effect": "Allow",
      "Action": [
        "s3:PutObject",
        "s3:GetObject",
        "s3:ListBucket",
        "s3:DeleteObject"
      ],
      "Resource": [
        "arn:aws:s3:::YOUR-BUCKET-NAME",
        "arn:aws:s3:::YOUR-BUCKET-NAME/*"
      ]
    }
  ]
}

Datalake

  1. Click Next: Review.
  • Tại mục Review policy đặt Name policy là yourname-datalake-policy.
  • Click Create policy.
  1. Click Role, sau đó click Create role.
  2. Click chọn AWS service.
  • Click chọn Glue.
  • Click Next: Permissions.

Datalake

  1. Tại mục Attach permissions policies.
  • Điền datalake để tìm kiếm policy.
  • Click chọn policy yourname-datalake-policy.

Datalake

  1. Tiếp tục tại mục Attach permissions policies.
  • Điền glueservice để tìm kiếm policy.
  • Click chọn policy AWSGlueServiceRole.

Datalake

  1. Click Next: Tags, sau đó click Next: Review.
  • Đặt Role name là AWSGlueServiceRole-yourname-datalake.
  • Click Create role.

Ở bước này chúng ta đã tạo Role để cấp quyền cho tiến trình Glue Crawler ở bước tiếp theo. Trong bước tiếp theo chúng ta sẽ tạo Crawler job để khám phá dữ liệu và lưu thông tin metadata vào Glue data catalog.