¿Las fuentes de datos de la empresa están sucias, son ruidosas o redundantes? Tamr, disponible a través de HPE Complete, puede limpiar y unificar los datos. El software y los servicios de Tamr ayudan a las empresas a acelerar y escalar los proyectos basados en datos. Tamr aplica el aprendizaje automático complementado con el conocimiento experto de los clientes para automatizar la unificación de grandes cantidades de silos de datos; todo ello a un coste y un consumo de tiempo mucho menores del que presentan otros enfoques alternativos. El resultado final es un conjunto de datos gestionados, limpios y precisos. Tamr es utilizado por las empresas para una amplia gama de aplicaciones, como la optimización de gastos, perspectiva única de un cliente, integración de datos biofarmaceúticos y cumplimiento de normativas. Basado en el software patentado de Michael Stonebraker, ganador del premio Turing, el software de Tamr permite a los clientes transformar el enfoque de la unificación de los datos para revelar nuevos conocimientos analíticos. Varias empresas de la lista Fortune 500 han logrado resultados transformadores al asociarse con Tamr.

Novedades

  • Tamr es una nueva oferta de HPE Complete

Características

La fase de conexión

Tamr, disponible a través de HPE Complete, trabaja con el cliente para definir los objetivos del proyecto e identificar las entidades (por ejemplo, persona, lugar o cosa) que el usuario desea ver de forma unificada para su posterior análisis.

Tamr alinea todos los atributos relevantes del conjunto de datos fuente en un esquema unificado que es más relevante y efectivo para los objetivos del proyecto.

El uso guiado del aprendizaje automático se usa para unificar estos conjuntos de datos y ofrece una mejora significativa en términos de velocidad y escalabilidad en comparación con métodos tradicionales basados en secuencias escritas de comandos.

La fase de limpieza

Tamr deduplica y gestiona las entidades en los conjuntos de datos unificados de forma eficiente y precisa mediante aprendizaje automático con uso guiado.

La cuestión de los datos sucios y duplicados en los sistemas de datos empresariales es extremadamente habitual y muy difícil de resolver mediante técnicas convencionales de gestión de datos.

La función principal de esta fase de Tamr es registrar las coincidencias y deduplicarlas, en base a la tecnología impulsada por la máquina de Tamr y de un enfoque guiado humano.

La fase de clasificación

Cuando Tamr termina de producir un conjunto de datos limpios y unificados de una entidad en concreto, el usuario tiene la opción de «clasificar» los registros en una taxonomía común o específica de la empresa para disponer de más capacidades de análisis en profundidad.

Esto se da particularmente en casos de uso de cadenas de suministro o de análisis de adquisición, donde las taxonomías ayudan a organizar a las entidades en grupos lógicos con fines analíticos y empresariales.

La fase de clasificación de Tamr funciona de la misma manera que la fase de conexión y de limpieza.