104.9. charset 사용
Camel 2.9.3
charset 옵션을 사용하면 소비자 및 생산자 끝점에서 파일 인코딩을 구성할 수 있습니다. 예를 들어 utf-8 파일을 읽고 파일을 iso-8859-1로 변환하려면 다음을 수행할 수 있습니다.
from("file:inbox?charset=utf-8") .to("file:outbox?charset=iso-8859-1")
경로에서 convertBodyTo
를 사용할 수도 있습니다. 아래 예제에서는 여전히 utf-8 형식의 입력 파일이 있지만 iso-8859-1 형식의 바이트 배열로 파일 콘텐츠를 변환하고 싶습니다. 그런 다음 blank에서 데이터를 처리하도록 합니다. 현재 charset을 사용하여 아웃 박스 폴더에 내용을 작성하기 전에 다음을 수행하십시오.
from("file:inbox?charset=utf-8") .convertBodyTo(byte[].class, "iso-8859-1") .to("bean:myBean") .to("file:outbox");
소비자 끝점에서 charset를 생략하면 Camel에서 파일의 charset을 알 수 없으며 기본적으로 "UTF-8"을 사용합니다. 그러나 org.apache.camel.default.charset
키로 다른 기본 인코딩을 재정의하고 사용하도록 JVM 시스템 속성을 구성할 수 있습니다.
아래 예제에서 이 문제는 파일을 읽는 기본 인코딩인 UTF-8 인코딩이 아닌 경우 문제가 될 수 있습니다.
이 예제에서는 파일을 작성할 때 콘텐츠가 이미 바이트 배열로 변환되어 있으므로 추가 인코딩 없이 그대로 콘텐츠를 작성합니다.
from("file:inbox") .convertBodyTo(byte[].class, "iso-8859-1") .to("bean:myBean") .to("file:outbox");
또한 Exchange.CHARSET_NAME
키를 사용하여 교환에 속성을 설정하여 파일을 작성할 때 인코딩 동적인 인코딩을 재정의하고 제어할 수도 있습니다. 예를 들어 아래 경로에서 메시지 헤더의 값으로 속성을 설정합니다.
from("file:inbox") .convertBodyTo(byte[].class, "iso-8859-1") .to("bean:myBean") .setProperty(Exchange.CHARSET_NAME, header("someCharsetHeader")) .to("file:outbox");
상황을 더 간단하게 유지하는 것이 좋습니다. 따라서 동일한 인코딩을 사용하여 파일을 선택하고 특정 인코딩에 파일을 작성하려는 경우 엔드포인트에서 charset
옵션을 사용하는 것이 좋습니다.
엔드포인트에서 charset
옵션을 명시적으로 구성한 경우 Exchange.CHARSET_NAME
속성에 관계없이 해당 구성이 사용됩니다.
문제가 있는 경우 org.apache.camel.component.file
에서 DEBUG 로깅을 활성화하고 특정 charset을 사용하여 파일을 읽고 쓸 때 Camel 로그를 활성화할 수 있습니다.
예를 들어 아래 경로는 다음을 기록합니다.
from("file:inbox?charset=utf-8") .to("file:outbox?charset=iso-8859-1")
및 로그:
DEBUG GenericFileConverter - Read file /Users/davsclaus/workspace/camel/camel-core/target/charset/input/input.txt with charset utf-8 DEBUG FileOperations - Using Reader to write file: target/charset/output.txt with charset: iso-8859-1