Tamr bietet Software und Services, um großen Unternehmen dabei zu helfen, ihre datenorientierten Projekte zu beschleunigen und zu skalieren. Tamr setzt maschinelles Lernen ein, das durch das Fachwissen der Kunden ergänzt wird, um die Vereinheitlichung von zahlreichen Datensilos in einem Bruchteil der Zeit und zu einem Bruchteil der Kosten alternativer Ansätze zu automatisieren. Wenn Unternehmensdatenquellen voll mit nicht bereinigten, redundanten und verrauschten Daten sind, kann Tamr diese Daten bereinigen und vereinheitlichen. Das Endresultat ist ein Satz an bereinigten und präzisen Daten und Stammdaten. Tamr wird von Unternehmen für verschiedenste Anwendungen eingesetzt - unter anderem für die Optimierung der Ausgaben, ein einheitliches Kundenbild, eine biopharmazeutische Datenintegration und die Einhaltung gesetzlicher Bestimmungen. Die Software von Tamr, die auf patentierter Software des Turing Award-Gewinners Michael Stonebraker basiert, ermöglicht es Kunden, ihren Ansatz zur Vereinheitlichung von Daten zu transformieren, um neue analytische Einblicke zu gewinnen. Unternehmen wie GE, Toyota, Thomson Reuters, Huawei, GSK und weitere haben durch die Zusammenarbeit mit Tamr transformative Resultate erzielt.

Neuerungen

  • Tamr ist ein neues Angebot von HPE Complete.

Funktionen

Die Verbindungsphase

Projektziele werden definiert und Einheiten (z. B. Person, Ort oder Gegenstand) identifiziert, von denen der Nutzer zur nachfolgenden Analyse eine einheitliche Ansicht möchte.

Tamr richtet alle relevanten Quell-Datensatz-Attribute auf ein einheitliches Schema aus, das am effektivsten und relevantesten für die Projektziele ist.

Durch den Menschen geführtes maschinelles Lernen wird eingesetzt, um diese Datensätze zu vereinen und bietet außerdem, im Vergleich zu traditionellen Methoden, die auf dem Schreiben von Skripten basieren, eine erhebliche Verbesserung hinsichtlich Geschwindigkeit und Skalierung.

Die Bereinigungsphase

Effiziente und präzise Deduplizierung und Verarbeitung der Einheiten innerhalb des einheitlichen Datensatzes durch den Einsatz von durch den Menschen geführtes maschinelles Lernen

Das Problem der nicht bereinigten, doppelten Daten in Unternehmensdatensystemen ist extrem verbreitet und mithilfe von herkömmlichen Datamanagement-Techniken nur äußerst schwierig zu lösen.

Die Hauptfunktion dieser Phase von Tamr ist der Datensatzabgleich und die Deduplizierung mithilfe des maschinell gesteuerten, durch den Menschen geführten Ansatzes von Tamr.

Die Klassifizierungsphase

Sobald ein bereinigter, vereinheitlichter Datensatz einer bestimmten Einheit durch Tamr erstellt wurde, hat der Nutzer die Möglichkeit, die Aufzeichnungen in einer unternehmensspezifischen oder häufig verwendeten Taxonomie für eine Verarbeitung mit detaillierteren Analysefunktionen zu klassifizieren.

Dies gilt insbesondere innerhalb von Anwendungsfällen, wie beispielsweise bei der Analyse der Lieferkette oder der Beschaffung - wobei Taxonomien dabei helfen, Einheiten für geschäftliche und Analysezwecke logisch zu gruppieren.

Die Klassifizierungsphase von Tamr arbeitet auf dieselbe Weise wie die Verbindungs- und Bereinigungsphasen.