第321章 tika コンポーネント
Camel バージョン 2.19 から利用可能
Tika: コンポーネントは、Apache Tika でドキュメントを検出して解析する機能を提供します。このコンポーネントは、ドキュメントを操作する基礎となるライブラリーとして Apache Tika を使用します。
Tika コンポーネントを使用するには、Maven ユーザーは以下の依存関係を pom.xml
に追加する必要があります。
pom.xml
<dependency> <groupId>org.apache.camel</groupId> <artifactId>camel-tika</artifactId> <version>x.x.x</version> <!-- use the same version as your Camel core version --> </dependency>
TIKA コンポーネントはプロデューサーエンドポイントのみをサポートします。
321.1. オプション
Tika コンポーネントにはオプションがありません。
Tika エンドポイントは、URI 構文を使用して設定します。
tika:operation
以下の path パラメーターおよびクエリーパラメーターを使用します。
321.1.1. パスパラメーター(1 パラメーター):
Name | 説明 | デフォルト | Type |
---|---|---|---|
operation | 必要な Tika 操作。解析または検出 | TikaOperation |
321.1.2. クエリーパラメーター(5 パラメーター):
Name | 説明 | デフォルト | Type |
---|---|---|---|
tikaConfig (producer) | tika Config | TikaConfig | |
tikaConfigUri (producer) | tika Config Uri: tika-config.xml の URI | 文字列 | |
tikaParseOutputEncoding (producer) | Tka Parse Output Encoding: 解析された出力の文字エンコーディングを指定するために使用されます。Defaults to Charset.defaultCharset() . | 文字列 | |
tikaParseOutputFormat (producer) | tika 出力形式。サポートされる出力形式。xml: 解析したコンテンツを XML として返します。html: 解析したコンテンツを HTML として返します。textMain: boilerpipe ライブラリーを使用して、Web ページからメインコンテンツを自動的に抽出します。 | xml | TikaParseOutputFormat |
同期 (詳細) | 同期処理を厳密に使用するか、Camel が非同期処理を使用できるようにするかを設定します(サポートされている場合)。 | false | boolean |