348장. Tika 구성 요소


Camel 버전 2.19에서 사용 가능

Tika: 구성 요소는 Apache Tika에서 문서를 감지하고 구문 분석할 수 있는 기능을 제공합니다. 이 구성 요소는 Apache Tika 를 기본 라이브러리로 사용하여 문서를 사용합니다.

Tika 구성 요소를 사용하려면 Maven 사용자가 pom.xml 에 다음 종속성을 추가해야 합니다.

pom.xml

<dependency>
    <groupId>org.apache.camel</groupId>
    <artifactId>camel-tika</artifactId>
    <version>x.x.x</version>
    <!-- use the same version as your Camel core version -->
</dependency>

TIKA 구성 요소는 생산자 끝점만 지원합니다.

348.1. 옵션

Tika 구성 요소에는 옵션이 없습니다.

Tika 엔드포인트는 URI 구문을 사용하여 구성됩니다.

tika:operation

다음 경로 및 쿼리 매개변수를 사용합니다.

348.1.1. 경로 매개 변수 (1 매개변수):

이름설명기본값유형

작업

필요한 Tika Operation. 구문 분석 또는 탐지

 

TikaOperation

348.1.2. 쿼리 매개변수 (5 매개변수):

이름설명기본값유형

tikaConfig (producer)

Tika Config

 

TikaConfig

tikaConfigUri (producer)

Tika Config Uri: tika-config.xml의 URI

 

문자열

tikaParseOutputEncoding (producer)

Tika Parse Output Encoding - 구문 분석 출력의 문자 인코딩을 지정하는 데 사용됩니다. 기본값은 Charset.defaultCharset()입니다.

 

문자열

tikaParseOutputFormat (producer)

Tika 출력 형식. 지원되는 출력 형식. xml: Returns Parsed Content as XML. html: Returns Parsed Content as HTML.text: Returns Parsed Content as Text. textMain: boilerpipe 라이브러리를 사용하여 웹 페이지에서 기본 콘텐츠를 자동으로 추출합니다.

xml

TikaParseOutputFormat

synchronous (advanced)

동기 처리를 엄격하게 사용해야 하는지 또는 Camel이 비동기 처리를 사용할 수 있는지 여부를 설정합니다(지원되는 경우).

false

boolean

Red Hat logoGithubRedditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

© 2024 Red Hat, Inc.