Tamr propose des logiciels et des services qui aident les grandes sociétés à accélérer et à faire évoluer leurs projets centrés sur les données. Tamr applique des solutions qui associent l’apprentissage automatique et la connaissance experte du client pour automatiser l'unification d'un grand nombre de silos de données – pour une dépense en argent et en temps très inférieure à celle des approches traditionnelles. Lorsque les sources de données de l'entreprise contiennent un volume élevé de données non nettoyées ou redondantes ou de « bruit », Tamr peut nettoyer et unifier ces données. Le résultat final est un dataset de référence complet et nettoyé. Tamr est utilisé par les entreprises pour un large éventail d'applications, y compris l'optimisation des dépenses, la vue unique de chaque client, l'intégration des données biopharmaceutiques et la conformité réglementaire. Basé sur un logiciel développé par Michael Stonebraker (lauréat du Turing Award), le logiciel Tamr permet aux clients de transformer leur approche de l'unification des données et d'extraire de celles-ci de nouvelles perspectives analytiques. En établissant un partenariat avec Tamr, des sociétés telles que GE, Toyota, Thomson Reuters, Huawei, GSK et bien d'autres ont obtenu des résultats transformationnels très convaincants

Nouveautés

  • Tamr est une nouvelle offre de HPE Complete

Caractéristiques

Phase de connexion

Les objectifs du projet sont définis et l'identification des entités (personne, lieu ou objet, ...) pour lesquelles l'utilisateur souhaite disposer d'une vue unifiée à des fins de l'analyse en aval est exécutée

Tamr aligne tous les attributs pertinents du dataset source vers le schéma unifié qui est le plus efficace et le mieux adapté aux objectifs du projet

L’apprentissage automatique à guidage humain est employé pour combiner ces datasets et apporter des améliorations significatives de vitesse et d'échelle par rapport aux méthodes traditionnelles qui s'appuient sur l'écriture de scripts

Phase de nettoyage

Dédupliquer les entités présentes dans le dataset unifié et créer la version de référence (master) de manière efficace et précise grâce à l’apprentissage automatique à guidage humain

Le problème des données non nettoyées et redondantes présentes dans les différents systèmes de l'entreprise est extrêmement fréquent et très difficile à résoudre avec les techniques conventionnelles de gestion des données

Cette phase de Tamr fait appel à l’apprentissage automatique à guidage humain, et elle a pour fonction principale de comparer et de dédupliquer les enregistrements

Phase de classification

Lorsqu'un dataset propre et unifié d'une entité spécifique a été généré par Tamr, l'utilisateur a la possibilité de « classifier » les enregistrements dans une taxonomie spécifique à son entreprise (ou utilisée couramment) pour disposer de capacités analytiques plus approfondies en aval

Cette phase est très utile dans les cas d'usage tels que l'analytique de la chaîne logistique ou l'approvisionnement : les taxonomies permettent d'organiser des entités en groupements logiques pour des besoins commerciaux et analytiques

La phase de classification de Tamr fonctionne de la même manière que les phases de connexion et de nettoyage