第72章 Tokenize


Tokenizer 言語は camel-core の組み込み言語であり、トークンベースの戦略を使用してメッセージを分割するために Split EIP で最もよく使用されます。

Tokenizer 言語は、指定された区切りパターンを使用してテキストドキュメントをトークン化することを目的としています。また、一部の機能が制限された XML ドキュメントをトークン化するために使用することもできます。真に XML に対応したトークン化を行うには、特に XML ドキュメントに対してより高速で効率的なトークン化を提供するため、XML Tokenize 言語を使用することをお勧めします。

72.1. Tokenize オプション

Tokenize 言語は、以下に示す 11 のオプションをサポートしています。

名前デフォルトJava タイプ説明

token

 

String

必須 Tokenizer として使用する (開始) トークン。たとえば、改行トークンを使用できます。Simple 言語をトークンとして使用して、動的トークンをサポートできます。

endToken

 

String

開始/終了トークンのペアを使用する場合に Tokenizer として使用する終了トークン。Simple 言語をトークンとして使用して、動的トークンをサポートできます。

inheritNamespaceTagName

 

String

XML の使用時にルート/親タグ名から名前空間を継承するにはタグ名として Simple 言語を使用して、動的な名前をサポートできます。

headerName

 

String

メッセージボディーを使用する代わりにトークン化するヘッダーの名前。

regex

 

ブール値

トークンが正規表現パターンの場合。デフォルト値は false です。

xml

 

ブール値

入力が XML メッセージかどうか。XML ペイロードを使用する場合は、このオプションを true に設定する必要があります。

includeTokens

 

ブール値

ペアを使用するときにトークンをパーツに含めるかどうか。デフォルト値は false です。

group

 

String

たとえば、大きなファイルを 1000 行のチャンクに分割するなど、N 個のパーツをグループ化します。グループとして Simple 言語を使用して、動的なグループサイズをサポートできます。

groupDelimiter

 

String

グループ化時に使用する区切り文字を設定します。これが設定されていない場合は、トークンが区切り文字として使用されます。

skipFirst

 

ブール値

最初の要素をスキップします。

trim

 

ブール値

値をトリミングして、先頭および末尾の空白と改行を削除するかどうか。

Red Hat logoGithubRedditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

© 2024 Red Hat, Inc.