検索

第321章 tika コンポーネント

download PDF

Camel バージョン 2.19 から利用可能

Tika: コンポーネントは、Apache Tika でドキュメントを検出して解析する機能を提供します。このコンポーネントは、ドキュメントを操作する基礎となるライブラリーとして Apache Tika を使用します。

Tika コンポーネントを使用するには、Maven ユーザーは以下の依存関係を pom.xml に追加する必要があります。

pom.xml

<dependency>
    <groupId>org.apache.camel</groupId>
    <artifactId>camel-tika</artifactId>
    <version>x.x.x</version>
    <!-- use the same version as your Camel core version -->
</dependency>

TIKA コンポーネントはプロデューサーエンドポイントのみをサポートします。

321.1. オプション

Tika コンポーネントにはオプションがありません。

Tika エンドポイントは、URI 構文を使用して設定します。

tika:operation

以下の path パラメーターおよびクエリーパラメーターを使用します。

321.1.1. パスパラメーター(1 パラメーター):

Name説明デフォルトType

operation

必要な Tika 操作。解析または検出

 

TikaOperation

321.1.2. クエリーパラメーター(5 パラメーター):

Name説明デフォルトType

tikaConfig (producer)

tika Config

 

TikaConfig

tikaConfigUri (producer)

tika Config Uri: tika-config.xml の URI

 

文字列

tikaParseOutputEncoding (producer)

Tka Parse Output Encoding: 解析された出力の文字エンコーディングを指定するために使用されます。Defaults to Charset.defaultCharset() .

 

文字列

tikaParseOutputFormat (producer)

tika 出力形式。サポートされる出力形式。xml: 解析したコンテンツを XML として返します。html: 解析したコンテンツを HTML として返します。textMain: boilerpipe ライブラリーを使用して、Web ページからメインコンテンツを自動的に抽出します。

xml

TikaParseOutputFormat

同期 (詳細)

同期処理を厳密に使用するか、Camel が非同期処理を使用できるようにするかを設定します(サポートされている場合)。

false

boolean

Red Hat logoGithubRedditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

© 2024 Red Hat, Inc.