第73章 XML トークン化
XML Tokenize 言語は camel-xml-jaxp
に組み込まれている言語であり、XML ドキュメントを効率的かつ効果的にトークン化するための従来の Tokenize として Split EIP と併用できる、XML を確実に認識する Tokenizer です。
XML Tokenize は、XML 名前空間とドキュメントの階層構造を認識するだけでなく、従来の Tokenize 言語よりも効率的に XML ドキュメントをトークン化することができます。
追加の依存関係
このコンポーネントを使用するには、次のような追加の依存関係が必要です。
<dependency> <groupId>org.codehaus.woodstox</groupId> <artifactId>woodstox-core-asl</artifactId> <version>4.4.1</version> </dependency>
または
<dependency> <groupId>org.apache.camel.springboot</groupId> <artifactId>camel-stax-starter</artifactId> </dependency>
73.1. XML Tokenizer のオプション
XML Tokenize 言語は、以下に示す 4 つのオプションをサポートしています。
名前 | デフォルト | Java タイプ | 説明 |
---|---|---|---|
headerName |
| メッセージボディーを使用する代わりにトークン化するヘッダーの名前。 | |
mode |
| 抽出モード。使用可能な抽出モードは次のとおりです。i は、抽出されたトークンにコンテキスト名前空間バインディングを注入します (デフォルト)。w は抽出されたトークンをその祖先コンテキストにラップします。u は抽出されたトークンをその子コンテンツにラップ解除します。t は指定された要素のテキストコンテンツを抽出します。 列挙値:
| |
group |
| N 個のパーツをグループ化します。 | |
trim |
| 値をトリミングして、先頭および末尾の空白と改行を削除するかどうか。 |