Kiểm tra encoding

Kiểm tra encoding

  1. Trong giao diện Cloud 9, chạy command dưới đây để kiểm tra encoding.
enca -L none ./raw/listings/LOAD00000001.csv 

Datalake

Nếu bạn sử dụng Data set của riêng mình và encoding không phải UTF-8 , bạn sẽ cần convert lại thành UTF8 sử dụng command dưới đây

sudo apt-get install libc6-dev
iconv -f <Encoding hiện tại> -t UTF-8 <path/dataset.csv>