1.2. 기능 저장소 개요


기능 저장소는 모델과 데이터 간의 인터페이스를 제공하는 OpenShift AI 구성 요소입니다. Feast 오픈 소스 프로젝트를 기반으로 합니다. 기능 저장소는 기존 인프라 및 데이터 저장소를 사용하여 머신러닝 모델에 기능을 저장, 관리 및 제공하기 위한 프레임워크를 제공합니다. 통합된 기능 관리 기능을 제공하여 다양한 데이터 소스에서 기능 데이터를 검색하고 기능을 생성하고 관리할 수 있습니다.

다음 그림은 Feature Store가 ML 워크플로에 적합한 위치를 보여줍니다. ML 워크플로에서 기능은 ML 모델에 대한 입력입니다. ML 워크플로는 트랜잭션 데이터, 고객 참조 및 제품 데이터와 같은 다양한 유형의 관련 데이터로 시작됩니다. 데이터는 다양한 데이터베이스 및 데이터 소스에서 가져옵니다. 이 데이터에서 ML 엔지니어는 기능 저장소를 사용하여 기능을 큐레이트합니다. 기능은 모델에 입력되며 모델은 기능의 데이터를 사용하여 예측을 만들 수 있습니다.

그림 1.1. ML 워크플로의 기능 저장소

ML 워크플로에서

기능 저장소는 다음과 같은 기능을 제공하는 머신 러닝 데이터 시스템입니다.

  • 원시 데이터를 기능 값으로 변환하는 데이터 파이프라인 실행
  • 기능 데이터 저장 및 관리
  • 교육 및 추론을 위해 지속적으로 기능 데이터를 제공
  • 오프라인 및 온라인 환경에서 지속적으로 기능 관리
  • 필요에 따라 한 모델 또는 수천 개의 새로운 기능을 통해 동시에 전원을 공급합니다.

기능 저장소는 ML 조직의 사용자가 협업할 수 있는 일반적으로 사용되는 기능을 저장, 처리 및 액세스하는 데 필요한 중앙 집중식 허브입니다. 기능 저장소에 기능을 등록하면 조직의 다른 모델에서 즉시 재사용할 수 있게 됩니다. Feature Store 레지스트리는 데이터 엔지니어링 작업의 중복을 줄이고 새로운 ML 프로젝트를 통해 큐레이션된 프로덕션 지원 기능 라이브러리를 사용하여 부트스트랩할 수 있습니다.

기능 저장소는 모델 교육 및 추론의 일관성을 제공하고, 여러 프로젝트에서 협업 및 사용성을 승격하고, 데이터 드리프, 누출 및 교육 스큐를 위한 모델의 경계 및 버전 관리를 모니터링하고 다른 MLOps 툴과 원활하게 통합됩니다. 기능 저장소는 BigQuery, Snowflake, Cryostat 및 Redis와 같은 다른 시스템에 저장된 데이터를 원격으로 관리하여 교육/서비스 시 기능을 일관되게 사용할 수 있도록 합니다.

기능 저장소는 다음 작업을 수행합니다.

  • 오프라인 및 온라인 저장소에 기능 저장
  • 공유를 위해 레지스트리에 기능 등록
  • ML 모델에 기능 제공

ML 플랫폼 팀은 기능 저장소를 사용하여 일괄 처리 및 온라인 실시간 모델 추론과 같은 오프라인 교육에 지속적으로 기능을 저장하고 제공합니다.

기능 저장소는 다음 주요 구성 요소로 구성됩니다.

레지스트리
모든 기능 정의의 중앙 카탈로그 및 관련 메타데이터입니다. 데이터 과학자는 새로운 기능을 검색, 검색 및 공동 작업할 수 있습니다. 레지스트리는 기능을 적용, 나열, 검색 및 삭제할 방법을 노출합니다.
오프라인 스토어
스케일 아웃 배치 점수 또는 모델 교육을 위한 기록 데이터가 포함된 데이터 저장소입니다. 오프라인 저장소는 기능 저장소에 수집된 배치 데이터를 유지합니다. 이 데이터는 데이터 세트를 교육하는 데 사용됩니다. 오프라인 저장소의 예로는 Dask, Snowflake, BigQuery, Redshift 및 DuckDB가 있습니다.
온라인 스토어
대기 시간이 짧은 기능 검색에 사용되는 데이터 저장소입니다. 온라인 스토어는 실시간 추론에 사용됩니다. 온라인 스토어의 예로는 Redis, GCP Datastore 및 Cryostat가 있습니다.
서버

온라인으로 미리 계산된 기능을 제공하는 기능 서버입니다. 세 가지 기능 저장소 서버가 있습니다.

  • 온라인 기능 서버 - JSON I/O와 함께 기능을 제공하는 HTTP 끝점인 Python 기능 서버입니다. HTTP 요청을 수행할 수 있는 프로그래밍 언어를 사용하여 온라인 저장소에서 기능을 작성하고 읽을 수 있습니다.
  • 오프라인 기능 서버 - gRPC 통신 프로토콜을 사용하여 데이터를 교환하는 Apache Arrow Flight Server입니다. 이 서버는 기존 오프라인 저장소 구현에 대한 호출을 래핑하고 인터페이스를 Arrow Flight 엔드포인트로 노출합니다.
  • 레지스트리 서버 - gRPC 통신 프로토콜을 사용하여 데이터를 교환하는 서버입니다. gRPC 요청을 수행할 수 있는 모든 프로그래밍 언어를 사용하여 서버와 통신할 수 있습니다.
UI
모든 기능 저장소 오브젝트 및 서로 간의 관계를 보기 위한 웹 기반 UI(그래픽 사용자 인터페이스)입니다.

기능 저장소는 다음과 같은 소프트웨어 기능을 제공합니다.

  • 기능 및 데이터 소스를 프로그래밍 방식으로 정의하는 Python SDK
  • 오프라인 및 온라인 데이터 저장소에 기능을 읽고 쓰는 Python SDK
  • API를 사용하여 기능을 읽고 쓰는 선택적 기능 서버(python 이외의 언어 사용)
  • 프로젝트에 정의된 기능에 대한 정보를 보고 탐색하는 웹 기반 UI
  • 기능 정보를 보고 업데이트하는 CLI(명령줄 인터페이스)
Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2026 Red Hat
맨 위로 이동