Sind Ihre Unternehmensdatenquellen voll von geänderten, redundanten und verrauschten Daten? Tamr, verfügbar über HPE Complete, kann die Daten bereinigen und vereinheitlichen. Tamr bietet Software und Services, um großen Unternehmen dabei zu helfen, ihre datenorientierten Projekte zu beschleunigen und zu skalieren. Tamr setzt maschinelles Lernen ein, das durch das Fachwissen der Kunden ergänzt wird, um die Vereinheitlichung von zahlreichen Datensilos in einem Bruchteil der Zeit und zu einem Bruchteil der Kosten alternativer Ansätze zu automatisieren. Das Endresultat ist ein Satz an bereinigten und präzisen Daten und Stammdaten. Tamr wird von Unternehmen für verschiedenste Anwendungen eingesetzt – unter anderem für die Optimierung der Ausgaben, ein einheitliches Kundenbild, eine biopharmazeutische Datenintegration und die Einhaltung gesetzlicher Bestimmungen. Die Software von Tamr, die auf patentierter Software des Turing Award-Gewinners Michael Stonebraker basiert, ermöglicht es Kunden, ihren Ansatz zur Vereinheitlichung von Daten zu transformieren, um neue analytische Einblicke zu gewinnen. Mehrere Fortune-500-Unternehmen haben durch die Partnerschaft mit Tamr transformative Ergebnisse erzielt.

Neuerungen

  • Tamr ist ein neues Angebot von HPE Complete.

Funktionen

Die Verbindungsphase

Tamr, verfügbar über HPE Complete, arbeitet mit dem Kunden zusammen, um Projektziele zu definieren und die Einheiten (z. B. Person, Ort oder Sache) zu identifizieren, die der Benutzer für eine einheitliche Sichtweise zum Zweck der Downstream-Analyse benötigt.

Tamr stimmt alle relevanten Quelldatensatzattribute auf ein einheitliches Schema ab, das für die Projektziele am effektivsten und relevantesten ist.

Durch den Menschen geführtes maschinelles Lernen wird eingesetzt, um diese Datensätze zu vereinen und bietet außerdem, im Vergleich zu traditionellen Methoden, die auf dem Schreiben von Skripten basieren, eine erhebliche Verbesserung hinsichtlich Geschwindigkeit und Skalierung.

Die Bereinigungsphase

Tamr dedupliziert und verarbeitet die Einheiten innerhalb des einheitlichen Datensatzes durch den Einsatz von durch den Menschen geführtem maschinellem Lernen.

Das Problem der nicht bereinigten, doppelten Daten in Unternehmensdatensystemen ist extrem verbreitet und mithilfe von herkömmlichen Datamanagement-Techniken nur äußerst schwierig zu lösen.

Die Hauptfunktion dieser Phase von Tamr ist das Abgleichen und Deduplizieren von Datensätzen, unterstützt vom maschinell gesteuerten, menschlich geführten Ansatz von Tamr.

Die Klassifizierungsphase

Sobald ein sauberer, einheitlicher Datensatz einer bestimmten Entität von Tamr erstellt wurde, hat der Benutzer die Möglichkeit, die Datensätze in eine unternehmensspezifische oder allgemein verwendete Taxonomie zu „klassifizieren“, um tiefergehende Analysemöglichkeiten zu erhalten.

Dies gilt insbesondere innerhalb von Anwendungsfällen, wie beispielsweise bei der Analyse der Lieferkette oder der Beschaffung - wobei Taxonomien dabei helfen, Einheiten für geschäftliche und Analysezwecke logisch zu gruppieren.

Die Klassifizierungsphase von Tamr arbeitet auf dieselbe Weise wie die Verbindungs- und Bereinigungsphasen.