第321章 tika コンポーネント
Camel バージョン 2.19 から利用可能
Tika: コンポーネントは、Apache Tika でドキュメントを検出して解析する機能を提供します。このコンポーネントは、ドキュメントを操作する基礎となるライブラリーとして Apache Tika を使用します。
Tika コンポーネントを使用するには、Maven ユーザーは以下の依存関係を pom.xml
に追加する必要があります。
pom.xml
TIKA コンポーネントはプロデューサーエンドポイントのみをサポートします。
321.1. オプション リンクのコピーリンクがクリップボードにコピーされました!
Tika コンポーネントにはオプションがありません。
Tika エンドポイントは、URI 構文を使用して設定します。
tika:operation
tika:operation
以下の path パラメーターおよびクエリーパラメーターを使用します。
321.1.1. パスパラメーター(1 パラメーター): リンクのコピーリンクがクリップボードにコピーされました!
Name | 説明 | デフォルト | Type |
---|---|---|---|
operation | 必要な Tika 操作。解析または検出 | TikaOperation |
321.1.2. クエリーパラメーター(5 パラメーター): リンクのコピーリンクがクリップボードにコピーされました!
Name | 説明 | デフォルト | Type |
---|---|---|---|
tikaConfig (producer) | tika Config | TikaConfig | |
tikaConfigUri (producer) | tika Config Uri: tika-config.xml の URI | 文字列 | |
tikaParseOutputEncoding (producer) | Tka Parse Output Encoding: 解析された出力の文字エンコーディングを指定するために使用されます。Defaults to Charset.defaultCharset() . | 文字列 | |
tikaParseOutputFormat (producer) | tika 出力形式。サポートされる出力形式。xml: 解析したコンテンツを XML として返します。html: 解析したコンテンツを HTML として返します。textMain: boilerpipe ライブラリーを使用して、Web ページからメインコンテンツを自動的に抽出します。 | xml | TikaParseOutputFormat |
同期 (詳細) | 同期処理を厳密に使用するか、Camel が非同期処理を使用できるようにするかを設定します(サポートされている場合)。 | false | boolean |