第 75 章 tokenize


令牌化语言是内置语言,其采用 camel-core,最常与 Split EIP 一起使用,使用基于令牌的策略来分割消息。

令牌编码语言旨在使用指定的分隔符模式对文本文档进行令牌化。它还可用于以一些有限功能对 XML 文档进行令牌化。对于真实的 XML 感知令牌化,建议使用 XML 令牌化 语言,因为它提供了更快速、更有效的令牌化,专门用于 XML 文档。

75.1. tokenize Options

Tokenize 语言支持 11 个选项,如下所列。

名称默认Java 类型描述

token

 

字符串

需要 用作 tokenizer 的令牌,例如您可以使用新行令牌。您可以使用简单语言作为令牌来支持动态令牌。

endToken

 

字符串

如果使用 start/end 令牌对,则用作 tokenizer 的最终用户。您可以使用简单语言作为令牌来支持动态令牌。

inheritNamespaceTagName

 

字符串

要在使用 XML 时从 root/parent 标签名称继承命名空间,您可以使用简单语言作为标签名称来支持动态名称。

headerName

 

字符串

要解码的标头名称,而不是使用邮件正文。

regex

 

布尔值

如果令牌是正则表达式模式。默认值为 false。

XML

 

布尔值

输入是否是 XML 消息。如果使用 XML 有效负载,则必须将这个选项设置为 true。

includeTokens

 

布尔值

在使用对对值时,是否将令牌包含在部分中,默认值为 false。

group

 

字符串

将 N 部分分组在一起,例如将大型文件分成 1000 行的块。您可以使用简单语言作为组来支持动态组群大小。

groupDelimiter

 

字符串

设置分组时要使用的分隔符。如果没有设置,则令牌将用作分隔符。

skipFirst

 

布尔值

用于跳过前一个元素。

trim

 

布尔值

是否修剪值以移除前导和结尾的空格和换行符。

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.