Test : EUC-KR <---> UTF-8

본 테스트는 html, php 등 영어 외에 한글, 일본어, 중국어 등이 포함된 웹파일의
(1) 소스코드자체

(2) 파일저장 HEX 타입

(1), (2) 라는 다양한 조건에 따라 웹브라우져에 한글이 잘 보이나 테스트하고
가장 잘 보이게 하는 방법이 무엇인지 알아 보는 것이다.

- 참고: 웹브라우져는 언어 인코딩을 자동선택으로 체크했다.

단, 웹서버 (리눅스, 윈도우 등)의 환경설정값은 알 수 없어 테스트 환경 조건에서 제외
또한 .htaccess 설정값에 따르는 영향도 알 수 없어 테스트 환경 조건에서 제외


중요참고 - 아해행의 편집기 주의) 텍스트 편집기에 따라 분명히 잘못된 한글 소스임에도
편집에서 열어보면 제대로 안보이거나 또는 잘 보이는 경우가 있다.
특히 국산인 Editplus 와 외산인 EMeditor, Notepad++ 등에서 이런 경우가 있으므로
한글(특히 아해행)의 정상출력 / 비정상 출력에 대해 혼동하면 안된다.



- 웹에서든 서버에서든 한글이 깨져 있을때의 문제점
- 한글이름의 파일이 다운로드가 되지 않는다.
- FTP 에서 전송이 안된다.



아행행 백 >>>> 아햏햏 뷁 붹 >> 잘 보이나요?

잘 보인다면 그 이유는
여러분이 현재 보고 있는 이 문서는 텍스트에디터에서 UTF-8로 편집저장했기 때문

아래를 참조
(1) 파일 소스 : < meta http-equiv="content-type" content="text/html; charset=utf-8" >
(2) 파일저장 HEX 타입 : UTF-8
(3) 한글의 입력 : 아해행

수정할 것 : 언어 meta 태그 충돌만 없으면 조합형이든 완성형이든 아해행은 잘 나온다. ** 중요
1. End-User 입장에서는 IE 등 브라우져에 불완전한 기능이지만 [자동 인코딩] 기능이 있기때문에
서버가 [EUC-KR] 이든 [UTF-8] 이든 일단은 중요하지 않다.

2. 파일 내부 meta 소스가 [charset=utf-8]이면 파일 저장 타입도 [UTF-8] 이어야 한다.
(참고: 서버가 리눅스라면 개행문자는 Unix 형태로 하는 것을 권장)

3. 텍스트 에디터 테스트 결과: Editplus가 가장 안정적이며, Notepad++을 혼합해서 사용해야 한다.
EMeditor가 인코딩이 안정적이다라는 인터넷 소문은 잘 못된 것 같다.
이유: 본 문서 테스트 환경에서 EMeditor 은 파일 내부의 조합형 한글이 날라가 버려 복구 불가능
그러나 이때 당황하지 말고, 여러 종류의 에디터로 열어 보면 복구가능
(EMeditor는 파일메뉴> 다시 로드하면 인코딩을 재선택해서 파일을 다시 열어준다.
(Editplus에서 문서> 인코딩 변경로드와 같음)
(이와 같이 인코딩 변경 reload 가 필요하다는 것은 에디터 자체의 기능적 안정성에 대한 문제이고
테스트 결과 Editplus가 이런 reload 작업이 필요없을 정도로 문서인식을 잘 했다.
그러나 잘못하면 절대 복구 불가능하다.
(Ultraedit 은 테스트하지 않음)

4.일반 text 든 PHP 등의 소스 파일이든 텍스트 타입의 파일에서
그 안에 한글이 있다면 (1) 파일내용 확인 (2) 브라우징 테스트를 통하여
혹시 한글이 깨지거나 깨져있는지 주의해야 한다.
만약 소스코드 안에 중요한 주석들을 많이 달아놨는데 깨져버리면 큰 낭패인 것이다.

5. FTP client 를 접속한 후에 소스파일 편집시 가능한 local로 다운로드해서 작업해야 한다.
또한 텍스트 에디터의 백업기능을 켜고 해야 한다.


6. 참고
Filezilla 같은 FTP 클라이언트에서도 설정해줘야 하는 것이 있는데
서버에서 파일명에 사용하는 문자셋 인코딩 부분이다.
사이트 관리자에 원격서버에서 UTF-8을 지원하면 자동감지사용하고, 아니면 로컬의 문자셋을 사용한다.
참고로 이것은 FTP 전송모드(데이터 유형의 바이너리 전송 등)과 개념이 다름에 주의한다.


** 결과 Result

Text에디터에서 위 이미지와 같은 조합형 한글은 글자가 아예 날라가서 복구 불가능
(완성형 한글은 무관함)
테스트 환경
- 파일형식은 EUC-KR 로 저장 - 그러나, 메타META태크는 charset=utf-8
- 브라우저 IE 인코딩 자동설정
- 본 테스트와 무관한 것으로 생각되나, 테스트 서버의 mySQL DB는 UFT8 로 세팅되어 있음

테스트 보기

** 웹소스의 웹브라우징 테스트 조건
- 서버에 저장된 파일의 ASCII 타입은 (1) ANSI (euc-kr) 이지만 (즉, 편집기에서 한국어로 저장) 소스자체 (2) 메타태그는 utf-8 로 설정함
- 그러나 아파치 서버의 DefaultCharset 이런 부분의 설정값은 현재 알 수 없음
- 웹브라져(크롬)의 인코딩 설정은 (1) 자동선택으로 되어 있으며 (2) 메타태크를 먼저 인식하는지 유니코드(UTF-8)로 선택되어 있다.
- 물론 브라우져 인코딩을 한국어로 체크하면 완성형 한글은 잘 보인다.
- 그러나 조합형 한글인 "아해행"이 깨지는 이유는 편집기자체에서는 입력할때 보이지만
- "파일 저장" 즉, "Hex Code 인코딩"을 EUC-KR로 했기때문이다..
- < meta charset="utf-8" >
-











문의메일 :
see@seehee.net