20.11. 使用 charset
charset 选项允许在使用者和制作者端点上配置文件的编码。例如,如果读取 utf-8 文件,并希望将文件转换为 iso-8859-1,您可以执行以下操作:
from("file:inbox?charset=utf-8") .to("file:outbox?charset=iso-8859-1")
您也可以在路由中使用 convertBodyTo
。在以下示例中,我们仍然具有 utf-8 格式的输入文件,但我们希望将文件内容转换为字节阵列(以 iso-8859-1 格式)。然后让一个 bean 处理数据。在使用当前的 charset 将内容写入 outbox 文件夹前。
from("file:inbox?charset=utf-8") .convertBodyTo(byte[].class, "iso-8859-1") .to("bean:myBean") .to("file:outbox");
如果您在消费者端点上省略 charset,则 Camel 不知道文件的 charset,默认情况下将使用 "UTF-8"。但是,您可以配置 JVM 系统属性,以覆盖和使用键 org.apache.camel.default.charset
的不同默认编码。
在以下示例中,如果文件不在 UTF-8 编码中,则这可能是问题,这是用于读取文件的默认编码。
在本例中,在编写文件时,内容已经转换为字节阵列,因此,可直接将内容写为 (没有任何进一步的编码)。
from("file:inbox") .convertBodyTo(byte[].class, "iso-8859-1") .to("bean:myBean") .to("file:outbox");
您还可以通过使用密钥 Exchange.CHARSET_NAME
在交换上设置属性,覆盖和控制编码动态。例如,在下面的路由中,我们使用来自邮件标题的值设置 属性。
from("file:inbox") .convertBodyTo(byte[].class, "iso-8859-1") .to("bean:myBean") .setProperty(Exchange.CHARSET_NAME, header("someCharsetHeader")) .to("file:outbox");
我们建议让事情变得更简单,因此,如果您选择具有相同编码的文件,并希望在特定编码中写入文件,然后使用端点上的 charset
选项。
请注意,如果您在端点上明确配置了 charset
选项,那么无论 Exchange.CHARSET_NAME
属性是什么,都将使用该配置。
如果有一些问题,您可以在 org.apache.camel.component.file
上启用 DEBUG 日志记录功能,并在读取/写入文件时使用特定的 charset 进行文件。
例如,以下路由将记录以下内容:
from("file:inbox?charset=utf-8") .to("file:outbox?charset=iso-8859-1")
和日志:
DEBUG GenericFileConverter - Read file /Users/davsclaus/workspace/camel/camel-core/target/charset/input/input.txt with charset utf-8 DEBUG FileOperations - Using Reader to write file: target/charset/output.txt with charset: iso-8859-1