Tamr는 대기업이 데이터 중심 프로젝트를 가속화하고 확장하는 데 도움이 되는 소프트웨어와 서비스를 제공합니다. Tamr는 고객의 전문 지식으로 보완된 기계 학습을 적용하여 대체 접근 방식의 시간과 비용보다 훨씬 적은 대규모 데이터 사일로의 통합을 자동화합니다. 엔터프라이즈 데이터 소스가 어지럽고 중복되며 마구 뒤섞인 데이터로 가득 차면 Tamr가 데이터를 정리하고 통합할 수 있습니다. 최종 결과로 정리되고 정확하며 완벽한 데이터 세트만 남습니다. 지출 최적화, 고객에게 단일화된 관점 제공, 의약품 데이터 통합과 규정 준수 등 기업은 광범위한 응용 분야에서 Tamr를 사용합니다. Turing Award 수상자인 Michael Stonebraker가 특허를 보유한 소프트웨어를 기반으로 Tamr의 소프트웨어는 고객이 새로운 분석 통찰력을 발견할 수 있도록 데이터 통합에 대한 접근 방식을 바꿀 수 있도록 합니다. GE, Toyota, Thomson Reuters, Huawei, GSK 등과 같은 기업은 Tamr와 파트너 관계를 맺어 변혁적인 결과를 얻었습니다.

새로운 기능

  • Tamr는 HPE Complete의 새로운 제품입니다.

특징

연결 단계

사용자가 다운스트림 분석을 목적으로 통합된 관점을 원할 때 프로젝트 목표가 정의되고 엔티티(예: 사람, 장소 또는 사물)가 식별됩니다.

Tamr는 모든 관련 소스 데이터 세트 속성을 프로젝트 목표에 가장 효과적이고 관련성이 높은 통합 스키마로 정렬합니다.

인간이 유도하는 기계 학습은 이러한 데이터 세트를 결합시키는 데 사용되고 스크립트 작성에 의존하는 기존 방법과 비교하여 상당히 개선된 속도와 규모를 제공합니다.

정리 단계

인간이 유도하는 기계 학습을 사용하여 통합 데이터 세트 내 엔티티를 효율적이고 정확하게 숙지하고 중복을 제거합니다.

엔터프라이즈 데이터 시스템 전반에 걸쳐 어지럽고 중복되는 데이터 문제는 매우 일반적이고 보통의 데이터 관리 기술을 사용하여 해결하기 매우 어렵습니다.

이 Tamr 단계에 대한 주된 기능은 Tamr의 기계 중심, 인간이 유도하는 접근 방식을 기반으로 하는 레코드 일치 및 중복 제거입니다.

분류 단계

Tamr가 특정 엔티티에 대한 통합된 순정 데이터 세트를 생성한 후 사용자는 보다 심층적인 분석 기능 다운스트림을 위해 회사별 또는 일반적으로 사용되는 분류별로 레코드를 “분류”할 수 있습니다.

이는 공급 체인이나 조달 분석과 같은 사용 사례 내에서 특히 그러하며, 비즈니스 및 분석을 목적으로 분류 작업을 통해 논리 그룹으로 엔티티를 구성하는 데 도움이 됩니다.

Tamr의 분류 단계는 연결 및 정리 단계와 동일한 방식으로 작동합니다.