티스토리 뷰

728x90

다국어 기반의 웹시스템이 늘어나고, POS를 비롯한 다양한 임베디드 장비가 늘어나고 있는 상황에서 한글 인코딩 때문에 종종 혼란을 겪는 상황은 독특한 언어와 문자를 가지고 있는 한중일 삼국의 문제가 아닌가 싶습니다. 최근의 웹시스템과 임베디드 시스템에서는 윈도우 운영체제의 인코딩인 CP949나 EUC-KR이 아닌 UTF-8 인코딩을 채용하는 사례가 늘어가고 일반화되는 추세이기 때문에 이런 혼란은 어찌보면 당연한 귀결이 아닌가 싶기도 합니다.

아무튼 UTF-8 인코딩을 사용하는 시스템에서 CSV파일과 같은 형태로 자료를 다운로드받아 엑셀로 열어보면 위의 그림과 같이 한글이 깨져보입니다. 이런 경우에는 UTF-8 인코딩을 인식할 수 있는 텍스트 편집기("무료 텍스트 편집기 jEdit 한글판 배포", "노트패드++ 한글 사용 환경 준비하기" 참조)나 윈도우 메모장(notepad)을 사용하여 인코딩을 엑셀이 인식할 수 있는 것으로 변환해서 읽으면 됩니다.

윈도우+r 단축키를 위와 같이 실행창을 띄우고 notepad [확인]으로 윈도우 메모장을 실행합니다.

메모장은 UTF-8과 윈도우 인코딩을 모두 인식할 수 있기 때문에 파일을 열었을때 위의 그림과 같이 내용이 정상적으로 보여야 합니다. 중간 중간의 작은 박스 모양은 윈도우와 유닉스 운영체제의 줄 구분 문자가 다르기 때문에 나오는 것으로 무시하고 다른이름으로 저장하기를 선택합니다.

다른 이름으로 저장하기를 선택하면 하단에 현재 파일의 인코딩이 표시됩니다. 인코딩을 "ANSI"로 선택하고 저장합니다. 현재 파일을 변경할 의도라면 동일한 이름으로 [저장]하면 됩니다.

위의 그림은 변환한 CSV파일을 엑셀로 열었을때 정상적으로 한글이 표시되는 것을 확인한 것입니다.

728x90
댓글
최근에 올라온 글
최근에 달린 댓글
«   2024/11   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
글 보관함