第75章 Tokenize
トークンライザー言語は camel-core の組み込み言語で、トークンベースのストラテジーを使用してメッセージを分割するために Split EIP で最もよく使用されます。
Tokenizer 言語は、指定された区切り文字パターンを使用してテキストドキュメントをトークン化することを目的としています。また、一部の限られた機能で XML ドキュメントをトークン化するために使用することもできます。XML 対応のトークン化には、XML ドキュメント専用のより高速で効率的なトークン化を提供するため、XML Tokenize 言語を使用することが推奨されます。
75.1. Tokenize オプション リンクのコピーリンクがクリップボードにコピーされました!
Tokenize 言語は、以下に示す 11 個のオプションをサポートします。
| 名前 | デフォルト | Java タイプ | 説明 |
|---|---|---|---|
| token |
| 必須: トークンライザーとして使用する(開始)トークン。たとえば、改行トークンを使用できます。動的トークンをサポートするトークンとして Simple 言語を使用できます。 | |
| endToken |
| 開始トークンと終了トークンのペアを使用する場合に tokenizer として使用する終了トークン。動的トークンをサポートするトークンとして Simple 言語を使用できます。 | |
| inheritNamespaceTagName |
| XML を使用する際にルート/親タグ名から名前空間を継承するには、タグ名として Simple 言語を使用して、動的な名前をサポートします。 | |
| headerName |
| メッセージボディーを使用する代わりにトークン化するヘッダーの名前。 | |
| regex |
| トークンが正規表現パターンの場合。デフォルト値は false です。 | |
| xml |
| 入力が XML メッセージであるかどうか。XML ペイロードを使用する場合は、このオプションを true に設定する必要があります。 | |
| includeTokens |
| ペアの使用時に部分にトークンを含めるかどうか。デフォルト値は false です。 | |
| group |
| N 部分をグループ化するには、たとえば、大きなファイルを 1000 行のチャンクに分割します。グループとして Simple 言語を使用すると、動的なグループサイズをサポートできます。 | |
| groupDelimiter |
| グループ化時に使用する区切り文字を設定します。これが設定されていない場合は、トークンが区切り文字として使用されます。 | |
| skipFirst |
| 最初の要素をスキップするには、次のコマンドを実行します。 | |
| trim |
| 値をトリミングして、先頭および末尾の空白と改行を削除するかどうか。 |