第72章 Tokenize
Tokenizer 言語は camel-core
の組み込み言語であり、トークンベースの戦略を使用してメッセージを分割するために Split EIP で最もよく使用されます。
Tokenizer 言語は、指定された区切りパターンを使用してテキストドキュメントをトークン化することを目的としています。また、一部の機能が制限された XML ドキュメントをトークン化するために使用することもできます。真に XML に対応したトークン化を行うには、特に XML ドキュメントに対してより高速で効率的なトークン化を提供するため、XML Tokenize 言語を使用することをお勧めします。
72.1. Tokenize オプション
Tokenize 言語は、以下に示す 11 のオプションをサポートしています。
名前 | デフォルト | Java タイプ | 説明 |
---|---|---|---|
token |
| 必須 Tokenizer として使用する (開始) トークン。たとえば、改行トークンを使用できます。Simple 言語をトークンとして使用して、動的トークンをサポートできます。 | |
endToken |
| 開始/終了トークンのペアを使用する場合に Tokenizer として使用する終了トークン。Simple 言語をトークンとして使用して、動的トークンをサポートできます。 | |
inheritNamespaceTagName |
| XML の使用時にルート/親タグ名から名前空間を継承するにはタグ名として Simple 言語を使用して、動的な名前をサポートできます。 | |
headerName |
| メッセージボディーを使用する代わりにトークン化するヘッダーの名前。 | |
regex |
| トークンが正規表現パターンの場合。デフォルト値は false です。 | |
xml |
| 入力が XML メッセージかどうか。XML ペイロードを使用する場合は、このオプションを true に設定する必要があります。 | |
includeTokens |
| ペアを使用するときにトークンをパーツに含めるかどうか。デフォルト値は false です。 | |
group |
| たとえば、大きなファイルを 1000 行のチャンクに分割するなど、N 個のパーツをグループ化します。グループとして Simple 言語を使用して、動的なグループサイズをサポートできます。 | |
groupDelimiter |
| グループ化時に使用する区切り文字を設定します。これが設定されていない場合は、トークンが区切り文字として使用されます。 | |
skipFirst |
| 最初の要素をスキップします。 | |
trim |
| 値をトリミングして、先頭および末尾の空白と改行を削除するかどうか。 |