第75章 Tokenize


トークンライザー言語は camel-core の組み込み言語で、トークンベースのストラテジーを使用してメッセージを分割するために Split EIP で最もよく使用されます。

Tokenizer 言語は、指定された区切り文字パターンを使用してテキストドキュメントをトークン化することを目的としています。また、一部の限られた機能で XML ドキュメントをトークン化するために使用することもできます。XML 対応のトークン化には、XML ドキュメント専用のより高速で効率的なトークン化を提供するため、XML Tokenize 言語を使用することが推奨されます。

75.1. Tokenize オプション

Tokenize 言語は、以下に示す 11 個のオプションをサポートします。

Expand
名前デフォルトJava タイプ説明

token

 

文字列

必須: トークンライザーとして使用する(開始)トークン。たとえば、改行トークンを使用できます。動的トークンをサポートするトークンとして Simple 言語を使用できます。

endToken

 

文字列

開始トークンと終了トークンのペアを使用する場合に tokenizer として使用する終了トークン。動的トークンをサポートするトークンとして Simple 言語を使用できます。

inheritNamespaceTagName

 

文字列

XML を使用する際にルート/親タグ名から名前空間を継承するには、タグ名として Simple 言語を使用して、動的な名前をサポートします。

headerName

 

文字列

メッセージボディーを使用する代わりにトークン化するヘッダーの名前。

regex

 

ブール値

トークンが正規表現パターンの場合。デフォルト値は false です。

xml

 

ブール値

入力が XML メッセージであるかどうか。XML ペイロードを使用する場合は、このオプションを true に設定する必要があります。

includeTokens

 

ブール値

ペアの使用時に部分にトークンを含めるかどうか。デフォルト値は false です。

group

 

文字列

N 部分をグループ化するには、たとえば、大きなファイルを 1000 行のチャンクに分割します。グループとして Simple 言語を使用すると、動的なグループサイズをサポートできます。

groupDelimiter

 

文字列

グループ化時に使用する区切り文字を設定します。これが設定されていない場合は、トークンが区切り文字として使用されます。

skipFirst

 

ブール値

最初の要素をスキップするには、次のコマンドを実行します。

trim

 

ブール値

値をトリミングして、先頭および末尾の空白と改行を削除するかどうか。

トップに戻る
Red Hat logoGithubredditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。 最新の更新を見る.

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

Theme

© 2025 Red Hat