2017년 11월 26일 일요일

python, read txt line-by-line

list = open(FILENAME).read().splitlines()

만약 한글이 있어서,
UnicodeDecodeError: 'cp949' codec can't decode byte 0xa7 in position 55: illegal multibyte sequence
이라면, 다음으로 대체

import codecs
list = codecs.open(FILENAME, 'r', 'utf-8').read().splitlines()

그럼에도 아래와 같은 에러가 생긴다면
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb0 in position
다음으로 대체

'utf-8' -> 'euc-kr'