Tamr ofrece software y servicios para ayudar a las grandes empresas a acelerar y escalar sus proyectos basados en datos. Tamr aplica el aprendizaje automático complementado con el conocimiento experto de los clientes para automatizar la unificación de grandes cantidades de silos de datos por una fracción del coste y del tiempo de enfoques alternativos. Tamr puede unificar y limpiar los datos cuando las fuentes de datos de las empresas están repletas de datos sucios, son redundantes y ruidosas. El resultado final es un conjunto de datos gestionados, limpios y precisos. Tamr es utilizado por las empresas para una amplia gama de aplicaciones, entre las que se incluyen la optimización de los gastos, la perspectiva única de un cliente, la integración de datos biofarmaceúticos y el cumplimiento de normativas. Basado en el software patentado del ganador del premio Turing, Michael Stonebraker, el software de Tamr permite a los clientes transformar el enfoque de la unificación de los datos para descubrir nuevos conocimientos analíticos. Empresas como GE, Toyota, Thomson Reuters, Huawei, GSK y otras han logrado resultados transformadores al asociarse con Tamr

Novedades

  • Tamr es una nueva oferta de HPE Complete

Características

La fase de conexión

Se definen los objetivos del proyecto y se identifican las entidades (por ejemplo, persona, lugar o cosa) que el usuario desea ver de forma unificada para su posterior análisis

Tamr alinea todos los atributos relevantes del conjunto de datos fuente en un esquema unificado que es más relevante y efectivo para los objetivos del proyecto

El uso guiado del aprendizaje automático se utiliza para unificar estos conjuntos de datos y ofrece una mejora significativa en términos de velocidad y escalabilidad en comparación con métodos tradicionales que se basan en secuencias escritas de comandos

La fase de limpieza

Deduplicación y gestión de las entidades en los conjuntos de datos unificados de forma eficiente y precisa a través del uso guiado del aprendizaje automático

La cuestión de los datos sucios y duplicados en los sistemas de datos empresariales es extremadamente común y muy difícil de resolver mediante técnicas convencionales de gestión de datos

La función principal de esta fase de Tamr es registrar las coincidencias y deduplicarlas, en base a la tecnología del enfoque guiado e impulsado por máquina de Tamr

La fase de clasificación

Cuando Tamr termina de producir un conjunto de datos limpios y unificados de una entidad en concreto, el usuario tiene la opción de «clasificar» los registros en una taxonomía común o específica de la empresa para más funciones transformadoras de análisis en profundidad

Esto es particularmente cierto en los casos de uso como las cadenas de suministro o los análisis de adquisición, donde las taxonomías ayudan a organizar a las entidades en grupos lógicos con fines analíticos y empresariales

La fase de clasificación de Tamr funciona de la misma manera que las fases de conexión y de limpieza